Konten

Ripping: OCR Hardsubbed Video

Mencuri takarir anda sejak abad ke-20

Diubah pada: 2021-02-20

Stealing your subtitle since 20th century

Yang dibutuhin:

  • PC
  • Vapoursynth
  • FFMpeg
  • YoloCR

Silakan ikuti instalasi Vapoursynth terlebih dahulu:

Install YoloCR

Langkah dengan gambar: Imgur

  1. Download YoloCR dari sini: https://bitbucket.org/YuriZero/yolocr/downloads/
  2. Extract ke suatu folder
  3. Install Cygwin: https://cygwin.com/setup-x86_64.exe
  4. Ketika install, pilih hal berikut:
    • bc
    • gnupg
    • links
    • make
    • perl
    • wget
    • tesseract-ocr (pilih versi 4.0+)
    • tesseract-ocr-eng (pilih versi 4.0+)
  5. Buka Cygwin
  6. Install GNU Parallel dari Terminal Cygwin:
    • wget -O - pi.dk/3 | bash
    • if [ -f ~/bin/parallel ]; then mv ~/bin/parallel /usr/local/bin/; fi
  7. Tambahkan tessdata indonesia

Menggunakan

Download salah satu file hardsub manapun dan taruh satu folder dengan YoloCR

Buka YoloResize.vpy dan modifikasi FichierSource=r'Vidéo_Source.mkv' ke video situ. (Yang tak pake oploverz BnHA movie 720.mkv)

Karena yang tak pake 720p ubah DimensionCropBox=[1344,150] sesuai resolusinya.

DimensionCropBox=[width,height] jadi maksimal width adalah 1280 yang tak tulis adalah [1100,150]

/assets/img/ocrhard/01.png
Atur cropping

Terlihat tidak pas sama sekali, jadi sekarang kita mainkan HauteurCropBox=46.

Agar terlihat mendingan, ini tak ubah ke HauteurCropBox=10

/assets/img/ocrhard/02.png
Atur cropping (2)

Sudah pas sekarang?, tutup file lalu buka YoloCR.vpy

Copy-Paste FichierSource=r'Vidéo_Source.mkv', DimensionCropBox=[1344,150], dan HauteurCropBox=46 dari file YoloResize.vpy

Klik F5 lalu atur SeuilI=230 dan SeuilO=80 agar teks sub terlihat enak.

Yang tak pake adalah SeuilI=225 dan SeuilO=70.

Setelah itu kasih # di sebelum FichierSource=r'Vidéo_Source.mkv jadi kayak gini: #FichierSource=r'Vidéo_Source.mkv, save & exit YoloCR.vpy.


Setelah itu, buka Cygwin dan ubah directory ke directory YoloCR. Cygwin menggunakan prefix /cygdrive/ untuk harddisk kita, jika situ save di C: maka ketik cd /cygdrive/c/ kalo D: ketik cd /cygdrive/d/ dst.

Karena folder saya ada di D:\VideoStuff\OCRTest\YoloCR maka kita akan tulis cd /cygdrive/d/VideoStuff/OCRTest/YoloCR

Jika file yang mau diubah berakhiran selain .mp4, ubah dengan ffmpeg: ffmpeg -i input.ext -c copy output.mp4

Setelah itu ketik for file in *.mp4; do filef="${file%.*}_filtered.mp4"; vspipe -y --arg FichierSource="$file" YoloCR.vpy - | ffmpeg -i - -c:v mpeg4 -qscale:v 3 -y "$filef"; ./YoloCR.sh "$filef"; done dan tunggu sebentar

/assets/img/ocrhard/05.png
Proses OCR

Jika sudah, selamat! sekarang waktunya buat versi yang ada di posisi atas.

Caranya sama aja, tinggal buka YoloCR.vpy lalu ubah HauteurCropBox=10 menjadi lebih tinggi misal HauteurCropBox=570

Sebelum mulai ngetik command untuk OCR di Cygwin, ubah nama file sebelumnya agar tidak di overwrite, misal jadi bnha.an2.srt

Gabungin kedua file bisa pake Aegisub

Selamat mencoba