]> jfr.im git - yt-dlp.git/commit
[webvtt] Merge daisy-chained duplicate cues (#638)
authorFelix S <redacted>
Mon, 9 Aug 2021 20:22:30 +0000 (20:22 +0000)
committerGitHub <redacted>
Mon, 9 Aug 2021 20:22:30 +0000 (01:52 +0530)
commit25a3f4f5d6de2bd5fb60cd11a46f0ac232882a56
tree3e3bbe3078fe903abbd0e6593a3a0e230564cdda
parentad3dc496bbf2e2a574a16244ddde0740778e5daf
[webvtt] Merge daisy-chained duplicate cues (#638)

Fixes: https://github.com/yt-dlp/yt-dlp/issues/631#issuecomment-893338552
Previous deduplication algorithm only removed duplicate cues with
identical text, styles and timestamps.  This change also merges
cues that come in ‘daisy chains’, where sequences of cues with
identical text and styles appear in which the ending timestamp of
one equals the starting timestamp of the next.

This deduplication algorithm has the somewhat unfortunate side effect
that NOTE blocks between cues, if found, will be emitted in a different
order relative to their original cues.  This may be unwanted if perfect
fidelity is desired, but then so is daisy-chain deduplication itself.
NOTE blocks ought to be ignored by WebVTT players in any case.

Authored by: fstirlitz
yt_dlp/downloader/fragment.py
yt_dlp/downloader/hls.py
yt_dlp/webvtt.py