Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用自建資料庫做比對

[圖文教學] 教你該如何使用 Subtitle Edit 將 Blu-ray 藍光的 .sup 圖片型字幕,或 DVD 之 .sub / .idx 圖片型字幕,轉換成 .srt 文字型字幕

Subtitle Edit 這套字幕處理軟體,有個 OCR 功能,用於識別 SUP 圖形或 SUB 圖形裡面的文字

所以先要了解 OCR 是什麼意思,可參考 wikipedia 光學字元辨識 內的解說

簡單的來說,就是辨識圖片內的文字,或識別圖形內的文字,這樣的功能,就叫做 OCR 光學字符識別





額。。。在上篇 Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用 TesserAct 做比對 是使用 TesserAct 提供的比對資料庫,中文比對效果,其實很差,幾乎都要重打,與其重打,不如自建,所以接下來,是要跟大家說明,如何自建比對資料庫,做比對

步驟一、開啟要處理的 .sup 或 .sub 檔案

建議,將副檔名顯示出來,方便查看檔案類型

你可以檔案 → 開啟,或指定類型,或是點擊 [ 開啟 ] 按鈕

選取要處理的 .sup 或 .sub 檔案,然後點擊開啟




步驟二、OCR 方式,切到 Binary image compare 二進位圖形比較




步驟三、像素數是空的,及最大錯誤%,推測是字距判斷,圖中為參考值,大家可試試抓抓看

OCR 自動修整/拼寫檢查,這個是英 法 德 荷 西 葡...等比較適用,繁體中文不適用,全取消

如果是轉英文字幕,可參考 Subtitle Edit OCR 文字辨識,將 sup/sub 轉成 srt 字幕,用 TesserAct 做比對 這篇,用 TesserAct 資料庫做比對,然後再參考 [Subtitle Edit 使用教學] 自動翻譯,能將英文字幕,自動翻成中文字幕 這篇,將英文字幕翻成中文字幕




步驟四、點擊 [ 新增 ] → 輸入英文任意名稱 → 確定




圖像資料庫,就會切換成你剛建的




步驟五、點擊 [ 開始進行 OCR ] ,進行比對




接下來,就是練打字的時間,看上方被紅色框框,框起的部分,下方的輸入框,輸入對應的字

此處每key完一個字,不用一直點 [ 確定 ] ,很沒效率,按下 Enter 鍵,就換下一個字




有的只抓到左邊,可以點擊 [ 展開選擇部分 ] ,就會全抓了




有的只抓到右邊,左邊抓不到,點擊 [ 中止 ] ,將由右至左打勾,點擊 [ 開始進行 OCR ] ,點擊 [ 展開選擇部分 ] ,就可以抓到了




有的要點擊 [ 展開選擇部分 ] 兩次才行




key太快,不小心key錯,點擊 [ 編輯上一個 ] 或點擊 [ 中止 ] → 點擊 [ 編輯 ] → 選取錯的 → 點擊 [ 更新 ] → 點擊 [ 確定 ] ,進行修正




OCR 處理完成之後,字幕框,還要校正一些,錯誤的字符,及多的空白

都ok後,才能點擊 [ 確定 ] 按鈕




步驟六、儲存 srt 檔案

點擊 [ 儲存 ] 按鈕
點擊 [ 存檔 ] 按鈕

可以使用 notepad++ 之類的文字編輯軟體,查看 .srt 檔案的內容







其他事項

千餘行。。。打不完,怎麽辦?不用擔心這個,直接關閉 Subtitle Edit 就可以,沒差的,下次重新進行 OCR 很快的

當中文字越來越多,資料越比越慢,因字型不同,準確度變低,可以至 Ocr 目錄,刪除你建的 .db 檔,或新建一個,比對資料庫,重新來過




如果你是用成外掛式字幕,要注意 .srt 字幕檔之檔名,必須要與影片檔名相同

這樣 萬能影音播放器 才能自動由外部抓取字幕




如果要用成 ass 特效字幕,請參考 [Subtitle Edit 使用教學] 將 srt 字幕轉換成 ass 字幕,及 ass 樣式調整

由於修正中文字的時間要很久,如果你只是要讓 萬能影音播放器 能夠顯示字幕,可參考 使用 BDSup2Sub 將 Blu-ray 藍光的 SUP 字幕,轉成 DVD 之 SUB/IDX 字幕 這篇,將 SUP 字幕轉成 SUB/IDX 字幕,這樣也行;只是 srt 字幕比較普及,汎用率較高;當然有時間能夠用成 srt 字幕,那是最好


後續文章 → [Subtitle Edit 使用教學] 製作字幕 入門篇


返回目錄 → ( 字幕編輯修改軟體 Subtitle Edit ) 之使用教學,連結總整理


對上述圖文教學,還不太明白的話,請至下方連結,查看 youtube 視頻解說

視頻解說之第一部分 https://www.youtube.com/watch?v=TIMLgv0rHkM

謝謝大家,抽空觀看,files備份檔名 converters01079

Teach you how to use OCR on Subtitle Edit software

沒有留言:

發佈留言

由於一直被灌水, 因此您發表留言之後, 需要等待博客主的審核, 才會公開您的留言, 所以請不要重複的留言
Hello my friend, I have no money, My blog is super chill, Please do not screw me up in the replies at the bottom of the article, thanks a lot