正则表达式

^\[\d+\].*?。$  -->   [3]参见《新唐书·王徽传》。>

[\d+] –> [9]

字幕文件:

匹配时间轴,例如’00:02:07,211 –> 00:02:08,379′
^(\d{2}):(\d{2}):(\d{2}),(\d{1,3})\s-->\s(\d{2}):(\d{2}):(\d{2}),(\d{1,3})$

字幕的行号和空行

^\d{1,3}\b ^\s

^[①②③④⑤⑥⑦⑧⑨⑩\s].*?\n —> 匹配①②③④⑤⑥⑦⑧⑨⑩开头的所有行

匹配数字,注释

\b\d{1,3}\b