-import base64
import re
-import urllib.parse
from .common import InfoExtractor
-from ..utils import (
- determine_ext,
- extract_attributes,
- get_elements_html_by_class,
- js_to_json,
- mimetype2ext,
- smuggle_url,
- traverse_obj,
-)
+from ..utils import determine_ext, js_to_json, mimetype2ext, traverse_obj
class TV24UAVideoIE(InfoExtractor):
self._search_json(
r'var\s*vPlayConfig\s*=\s*', webpage, 'thumbnail',
video_id, default=None, transform_source=js_to_json), 'poster')
- self._sort_formats(formats)
return {
'id': video_id,
'formats': formats,
'subtitles': subtitles,
'thumbnail': thumbnail or self._og_search_thumbnail(webpage),
- 'title': self._html_extract_title(webpage) or self._og_search_title(webpage),
+ 'title': self._generic_title('', webpage),
'description': self._og_search_description(webpage, default=None),
}
-
-
-class TV24UAGenericPassthroughIE(InfoExtractor):
- _VALID_URL = r'https?://(?:[a-zA-Z0-9]+?\.)?24tv\.ua/(?P<id>[^/]+?_n\d+)'
-
- _TESTS = [{
- # Generic iframe, not within media_embed
- 'url': 'https://24tv.ua/vipalyuyut-nashi-mista-sela-dsns-pokazali-motoroshni-naslidki_n1883966',
- 'info_dict': {
- 'id': '1883966',
- 'ext': 'mp4',
- 'title': 'Випалюють наші міста та села, – моторошні наслідки обстрілів на Чернігівщині',
- 'thumbnail': r're:^https?://.*\.jpe?g',
- }
- }, {
- # Generic iframe embed of TV24UAPlayerIE, within media_embed
- 'url': 'https://24tv.ua/harkivyani-zgaduyut-misto-do-viyni-shhemlive-video_n1887584',
- 'info_dict': {
- 'id': 'harkivyani-zgaduyut-misto-do-viyni-shhemlive-video_n1887584',
- 'title': 'Харків\'яни згадують місто до війни: щемливе відео'
- },
- 'playlist': [{
- 'info_dict': {
- 'id': '1887584',
- 'ext': 'mp4',
- 'title': 'Харків\'яни згадують місто до війни: щемливе відео',
- 'thumbnail': r're:^https?://.*\.jpe?g',
- },
- }]
- }, {
- # 2 media_embeds with YouTube iframes
- 'url': 'https://24tv.ua/bronetransporteri-ozbroyenni-zsu-shho-vidomo-pro-bronovik-wolfhound_n2167966',
- 'info_dict': {
- 'id': 'bronetransporteri-ozbroyenni-zsu-shho-vidomo-pro-bronovik-wolfhound_n2167966',
- 'title': 'Броньовик Wolfhound: гігант, який допомагає ЗСУ знищувати окупантів на фронті',
- },
- 'playlist_count': 2
- }, {
- 'url': 'https://men.24tv.ua/fitnes-bloger-sprobuvav-vikonati-trenuvannya-naysilnishoyi-lyudini_n2164538',
- 'only_matching': True,
- }]
-
- def _real_extract(self, url):
- display_id = self._match_id(url)
- webpage = self._download_webpage(url, display_id)
- data_urls = []
- # The site contains escaped iframe embeds within an attribute.
- # Once escaped, generic can handle them, so we use a data url to pass the escaped html back.
- for html in get_elements_html_by_class('media_embed', webpage):
- data = urllib.parse.unquote(extract_attributes(html).get('data-html'))
- data_urls.append(f'data:text/html;base64,{base64.b64encode(data.encode("utf-8")).decode("utf-8")}')
-
- if not data_urls:
- return self.url_result(url, 'Generic')
- return self.playlist_from_matches(
- [smuggle_url(url, {'to_generic': True}) for url in data_urls], display_id, ie='Generic',
- playlist_title=self._og_search_title(webpage) or self._html_extract_title(webpage))