[misc] Cleanup (#9765)

[yt-dlp.git] / yt_dlp / extractor / ceskatelevize.py
diff --git a/yt_dlp/extractor/ceskatelevize.py b/yt_dlp/extractor/ceskatelevize.py

index be2b0bb4333c8ddad6afa51364d1954b08c28927..5d633572962903918ee47ceff0f4505a3ea6490c 100644 (file)
--- a/yt_dlp/extractor/ceskatelevize.py
+++ b/yt_dlp/extractor/ceskatelevize.py
@@ -1,20 +1,20 @@
  import re
  
  from .common import InfoExtractor
-from ..compat import (
-    compat_urllib_parse_unquote,
-    compat_urllib_parse_urlparse,
-)
+from ..compat import compat_urllib_parse_unquote, compat_urllib_parse_urlparse
+from ..networking import Request
  from ..utils import (
      ExtractorError,
      float_or_none,
-    sanitized_Request,
      str_or_none,
      traverse_obj,
      urlencode_postdata,
-    USER_AGENTS,
  )
  
+USER_AGENTS = {
+    'Safari': 'Mozilla/5.0 (X11; Linux x86_64; rv:10.0) AppleWebKit/533.20.25 (KHTML, like Gecko) Version/5.0.4 Safari/533.20.27',
+}
+
  
  class CeskaTelevizeIE(InfoExtractor):
      _VALID_URL = r'https?://(?:www\.)?ceskatelevize\.cz/(?:ivysilani|porady|zive)/(?:[^/?#&]+/)*(?P<id>[^/#?]+)'
@@ -51,7 +51,7 @@ class CeskaTelevizeIE(InfoExtractor):
          'url': 'http://www.ceskatelevize.cz/ivysilani/zive/ct4/',
          'only_matching': True,
          'info_dict': {
-            'id': 402,
+            'id': '402',
              'ext': 'mp4',
              'title': r're:^ČT Sport \d{4}-\d{2}-\d{2} \d{2}:\d{2}$',
              'is_live': True,
@@ -97,11 +97,11 @@ class CeskaTelevizeIE(InfoExtractor):
      def _real_extract(self, url):
          playlist_id = self._match_id(url)
          webpage, urlh = self._download_webpage_handle(url, playlist_id)
-        parsed_url = compat_urllib_parse_urlparse(urlh.geturl())
+        parsed_url = compat_urllib_parse_urlparse(urlh.url)
          site_name = self._og_search_property('site_name', webpage, fatal=False, default='Česká televize')
          playlist_title = self._og_search_title(webpage, default=None)
          if site_name and playlist_title:
-            playlist_title = re.split(r'\s*[—|]\s*%s' % (site_name, ), playlist_title, 1)[0]
+            playlist_title = re.split(r'\s*[—|]\s*%s' % (site_name, ), playlist_title, maxsplit=1)[0]
          playlist_description = self._og_search_description(webpage, default=None)
          if playlist_description:
              playlist_description = playlist_description.replace('\xa0', ' ')
@@ -163,16 +163,16 @@ def _real_extract(self, url):
          entries = []
  
          for user_agent in (None, USER_AGENTS['Safari']):
-            req = sanitized_Request(
+            req = Request(
                  'https://www.ceskatelevize.cz/ivysilani/ajax/get-client-playlist/',
                  data=urlencode_postdata(data))
  
-            req.add_header('Content-type', 'application/x-www-form-urlencoded')
-            req.add_header('x-addr', '127.0.0.1')
-            req.add_header('X-Requested-With', 'XMLHttpRequest')
+            req.headers['Content-type'] = 'application/x-www-form-urlencoded'
+            req.headers['x-addr'] = '127.0.0.1'
+            req.headers['X-Requested-With'] = 'XMLHttpRequest'
              if user_agent:
-                req.add_header('User-Agent', user_agent)
-            req.add_header('Referer', url)
+                req.headers['User-Agent'] = user_agent
+            req.headers['Referer'] = url
  
              playlistpage = self._download_json(req, playlist_id, fatal=False)
  
@@ -183,8 +183,8 @@ def _real_extract(self, url):
              if playlist_url == 'error_region':
                  raise ExtractorError(NOT_AVAILABLE_STRING, expected=True)
  
-            req = sanitized_Request(compat_urllib_parse_unquote(playlist_url))
-            req.add_header('Referer', url)
+            req = Request(compat_urllib_parse_unquote(playlist_url))
+            req.headers['Referer'] = url
  
              playlist = self._download_json(req, playlist_id, fatal=False)
              if not playlist: