Vista2k7 โพสต์ 21-8-2012 10:50:30

วิธีการแปลงซับไทย IDX SUP เป็น SRT หรือ text (DVD Sub Extractor OCR subtitle IDX SUP to text)

DVDSubExtractor
วิธีแปลงไฟล์ .idx, .sup เป็น .srt หรือ .ass ได้ง่ายๆ และรวดเร็ว (อีกทางเลือก)

สิ่งที่ต้องเตรียมก่อน
1. โปรแกรม ชื่อ SubExtractor
https://www.videohelp.com/software/SubExtractor

โหลดได้ที่นี้ https://www.videohelp.com/software/SubExtractor ชื่อเต็มๆคือ Subtitle Extractor
2. Windows 7 ทำไมใช้ Windows XP ไม่ได้ล่ะ เหตุเพราะว่า Windows XP พิมพ์สระต่างๆ แล้วไม่แสดงเป็นตัวอักษรถ้าไม่มีตัวอักษรนำหน้า เพราะว่าโปรแกรมนี้จะเรียนรู้ทีละตัวอักษรที่พิมพ์ลงเท่านั้น

เมื่อเตรียมเรียบร้อยแล้วมาเริ่มกันเลย
เปิดโปรแกรมมาจะได้ หน้าตาแบบนี้ (ผมตัดส่วนขอบขวาออกไปนะครับ)


เมื่อกดปุ่ม แล้วจะได้


เมื่อเลือกไฟล์แล้วจะแสดงหน้าตาแบบนี้

เมื่อตรวจดูว่าเป็นซับที่ต้องการแปลง คลิ๊กปุ่ม

โปรแกรมจะเริ่มการทำ OCR ในหน้าตานี้ครับ

ตัวอย่าง


อีกตัวอย่าง

ถ้าเกิดโปรแกรมเจอแบบนี้ ก็กดปุ่ม แล้วระบายสีเขียวที่ตัวอักษร หรือสระก็ได้ เพียงตัวเดียวพอ เสร็จแล้วกดปุ่ม
เช่น ผมระบายสีที่ตัวอักษร ส แล้ว โปรแกรมจะให้ตัวอักษรตัว ส เสร็จแล้ว มันจะให้เราใส่ สระอื กับไม้โท แต่ใส่ไม่ได้
เพราะว่ามันเป็นรูปเดียวกันอยู่ ก็กดปุ่ม อีกครั้ง แล้วระบายสีที่สระ อื หรือ ไม้โท ก็ได้ แล้ว Save Split โปรแกรมจะให้เราใส่ สระอื และไม้โท ทีละตัว

อีกนิดครับ อาจจะติดตัวต่อไปนี้ ถ้าซับบรรทัดนั้นๆ ไม่มีตัว " หรือ ' ในส่วนปิดประโยค เช่น "ชัคบอกว่าแล้วจบบรรทัดไปโปรแกรมจะแจ้งว่า ตัวอักษรไม่ครบ ให้กด ปุ่ม Check box ที่แสดงขึ้นมา เหนือตาราง ABC ครับโปรแกรมก็จะทำการ OCR ต่อไปครับ

เมื่อโปรแกรมทำ OCR เสร็จแล้ว ทำตามภาพเลยครับ



จากรูปสุดท้ายถ้าเราเลือกไฟล์ซับมาแค่ไฟล์เดียว ปุ่ม จะไม่สามารถกดได้ ให้ไปคลิ๊กที่ แล้วเลือก

เสร็จแล้วครับ
โปรแกรมนี้ผมลองใช้แล้วแปลงได้เร็วดี ง่ายกว่า SubtitleEdit ผมแปลงซีรี่ย์จำนวน 24 ตอนใช้เวลา ครึ่งชั่วโมงก็เสร็จ
ถ้าอ่านแล้วไม่เข้าใจหรือติดตรงไหน ถามได้ครับ ถ้าผมเคยเจอนะ :loveliness:


ตัวอย่าง รวมตัวอักษรให้เป็น หนึ่งตัว
ภาษาไทย เช่น ตัวอักษร ญ, ฐ, สระอำ, สระอะ, สระแอ
ภาษาอังกฤษ เช่น ", :, %, =, !, ?

-


ตัวอย่าง การแยกส่วนที่ถูกวิธี


ตัวอย่าง โปรแกรมแบ่งตัวหนังสือแล้ว แสดงข้อมูลการแบ่งผิดตรงมุมขวาบน (ตัวหนังสือสีน้ำเงิน) หลังจากกดปุ่ม
1

2

วิธีแก้ ให้ระบายสีตรงส่วนที่มันระบาย โปรแกรมจะเปลี่ยนตัวอักษรให้ ถ้ายังแสดงไม่ถูกให้ระบายสีใหม่เอง

phanoom โพสต์ 22-8-2012 00:37:07

แก้ไขครั้งสุดท้ายโดย phanoom เมื่อ 22-8-2012 00:44

ไปลองทำมาแล้วจ๊ะ
- บอกคำเดียวว่าโปรแกรมเทพมากๆ OCR ยังกะติดจรวดไอพ่น
- เราลองทำ OCR เรื่อง Band.Of.Brothers.2001.Ep10.Points.BluRay.1080p.x264.DTS-WiKi
- ไวมากพิมพ์ไม่กี่ตัวเอง ไม่ถึง 10 นาที เสร็จแล้วเหรอ..
- มีคำผิดน้อยมาก แทบจะไม่มีเลย ติดตัวไม้เอกตัวเดียวมันไม่ยอมอ่านให้ คิดว่าต้องมานั่งพิมพ์ไม่เอกทีหลัง
- ลองเอาซับ OCR มาเปิดดู มีไม่เอกครบเฉยเลย ยังงงๆ ว่ามาได้ไง เฟอร์เฟ็คสุด
- ตอนนี้ได้โปรแกรมนี้ คงต้องรื้อซับ DVD ที่โมใส่หนังเก็บไว้ เอามาทำซับสวยๆ คมๆ ใช้งานใหม่อีกรอบแล้ว
- ได้ทั้ง SRT / ASS / ไปแปลงทำ PGS + Vobsub แบบ 1080p. ใช้งานได้แจ่มๆ ไปเลย
- ขอบคุณในน้ำใจท่านจริง ที่เอาความรู้ และโปรแกรมดีๆ มาแบ่งปันกันใช้งาน สวรรณ์มาโปรดจริงๆ

ปล. อันนี้เสริมนิดนึง พอดีตอนที่เราลงโปรแกรม มันถามหา NET Framework Version 4 ต้องลงตัวนี้ด้วย
      เผื่อใครไม่มีเลยเอามาฝากกันจ้า ลงเสร็จแล้ว รีสตาร์จคอม แล้วเข้ามารันโปรแกรม SubExtractor ได้เลยจ๊ะ
      เราใช้กับ Win7 64Bit Ram8GB ได้ไม่มีปัญหา

http://www.microsoft.com/en-us/download/details.aspx?id=17851
http://www.x64bitdownload.com/downloads/t-64-bit-microsoft-net-framework-4-download-yejevppa.html
http://www.filehippo.com/download_dotnet_framework_4/


http://uc.exteenblog.com/love-is-love/images/readhead/18.gifhttp://uc.exteenblog.com/love-is-love/images/readhead/18.gifhttp://uc.exteenblog.com/love-is-love/images/readhead/18.gifhttp://uc.exteenblog.com/love-is-love/images/readhead/18.gif

FreeAndFree โพสต์ 27-8-2012 20:37:25

วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียังเร็วขนาดนี้
แล้วถ้าเป็นซับจำพวก 1080p จะเร็วสักแค่ไหน (ตามที่คิดเองน่าจะเร็วขึ้น
เพราะตัวหนังสือคมกว่า)   ผลปรากฏว่าเราต้องสอนมันแทบจะทุกตัว
แม้แต่ตัวอักษรที่สอนมันไปแล้วไม่ทราบต้องตั้งค่าอะไรยังไงครับ
พอมีใครจะแนะนำได้บ้างครับ:L

Jingjok โพสต์ 28-8-2012 11:29:07

FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37 static/image/common/back.gif
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...

สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจะทำให้เพี้ยนเหมือนโปรแกรม OCR เอกสารทั่ว ๆ ไปหรือเปล่า

ผมเลยใช้วิธีแยกฐานข้อมูลเป็นเรื่องๆ แบบ Subtitle Edit

ลองดูนะครับ
1.ให้ Windows แสดงไฟล์ที่ซ่อนก่อน
2.ก่อนอื่นให้ลบฐานข้อมูลที่ติดมากับโปรแกรม มันจะเป็นไฟล์ชื่อ OcrMapOrig.bin ขนาดประมาณ 17 MB อยู่ในโฟลเดอร์ที่ติดตั้งโปรแกรมนั่นแหละครับ เพราะถ้าไม่ลบไฟล์นี้ ฐานข้อมูลของแต่ละเรื่องก็จะมีขนาดเริ่มต้น 17 MB ขั้นตอนนี้จะไม่ทำก็ได้ แต่มันจะเปลืองเนื้อที่ HD ไปเปล่า ๆ :D
3.ไปที่โฟลเดอร์ Users->(ชื่อผู้ใช้)->AppData->Local
4.จะเห็นไฟล์ชื่อ OcrMap.bin (ไฟล์นี้แหละครับที่เป็นตัวเก็บฐานข้อมูลที่เราทำไปแล้ว) ก็ให้เปลี่ยนชื่อไฟล์นี้ซะ อาจจะเพิ่ม (จุด)(ชื่อหนัง) ต่อท้ายไฟล์แบบผมก็ได้ครับ

5.ที่นี้พอเข้าโปรแกรม SubExtractor มันจะสร้างไฟล์ OcrMap.bin ขึ้นมาใหม่ ก็ทำ OCR ไปจนเสร็จ แล้วก็ไปเปลี่ยนชื่อไฟล์ตามข้อ 4
6.ก็จะได้ฐานข้อมูลแยกเป็นเรื่อง ๆ คล้าย Subtitle Edit ถ้าไปเจอซับที่ตัวคล้าย ๆ กับหนังที่เราทำไปแล้วก็ค่อยมาเปลี่ยนชื่อไฟล์ให้กลับมาเป็น OcrMap.bin ก่อนที่จะทำ OCR

หมายเหตุ : ผมลองทำกับไฟล์ 1080p พอเจอวรรณยุกต์ มันต้องคอยคลิก Ignore Baseline ตลอดเลยครับ ยังไม่ทราบวิธีแก้เหมือนกัน :L

dylanja โพสต์ 21-8-2012 12:06:16

น่าสนดีเหมือนกัน เดี๋ยวว่าง ๆ คงต้องลองขอลองหน่อย เผื่อเป็นทางเลือกที่ดีกว่า ขอบคุณมากครับ

vicvicky โพสต์ 21-8-2012 12:23:06

ขอบคุณมากครับ

non_naja โพสต์ 21-8-2012 13:54:15

ผมสนับสนุนให้แปลงไฟล์เป็น srt นะ เพราะใช้งานง่าย ตัวอักษรคมชัดบาดใจ อิอิ ;P

apollo14 โพสต์ 21-8-2012 15:09:09

ว้าวๆ ๆ ๆ ง่ายมากๆ จริงๆ ด้วยครับ
ดีกว่า SubtitleEdit จริงๆ

ทีแรก ยังงงๆ กะระบบ นิดหน่อย พอจับทางได้เท่านั้นแหละ ทำเรื่องละแค่ 5 นาที เสร็จ แถมยังแทบจะไม่มีผิดเลย

สุดยอดๆๆๆๆ

ขอบคุณผู้แนะนำด้วยนะครับ

Dnxy โพสต์ 21-8-2012 15:13:37

ง่าย เร็ว สุดยอด ขอบคุณมากครับ

dylanja โพสต์ 21-8-2012 15:55:22

โอ้ว... คณะเทพมายืนยันกันเพียบ สงกะสัยเจ๋งจริง :)

apollo14 โพสต์ 21-8-2012 16:38:02

apollo14 ตอบกลับเมื่อ 21-8-2012 15:09 static/image/common/back.gif
ว้าวๆ ๆ ๆ ง่ายมากๆ จริงๆ ด้วยครับ
ดีกว่า SubtitleEdit จริงๆ
...

ยิ่งทำหลายเรื่องยิ่งเร็วครับ เพราะมันจำตัวเก่าได้ ผมนั่งทำแป็บเดียวได้ 4 เรื่องละ

phanoom โพสต์ 21-8-2012 19:10:51

ต้องลองๆ ยืนยัน กันแบบนี้ ต้องของดีแท้แน่นอน
ขอบใจมากนะจ๊ะที่เอามาแบ่งปัน สิ่งดีๆ ให้แก่กัน
ท่าทางจะทำ SRT กันมันส์แน่ๆ
ตอนแรกใช้ SubtitleEdit ใช้เวลา 30-60 นาที แถมคำผิดเยอะแยะ
เห็นว่าโปรแกรมนี้ใช้เวลาแค่ 10-15 นาที คำผิดน้อยๆ นี่มันโปรแกรมเทพชัดๆ อิอิ
จัดไปๆ อย่าให้เสียของดีๆ Thank You

daimondus โพสต์ 21-8-2012 19:42:29

โปรแกรม เมพมาก ไวมากในการแกะตัวหนังสือ
แต่ติดที่ตัวสระ ที่มันยังต้องมาตามแก้อยู่
หน้า: [1] 2 3 4 5 6 7 8
ดูในรูปแบบกติ: วิธีการแปลงซับไทย IDX SUP เป็น SRT หรือ text (DVD Sub Extractor OCR subtitle IDX SUP to text)