[ie/mlbtv] Fix extraction (#10296)

[yt-dlp.git] / yt_dlp / extractor / webcaster.py
diff --git a/yt_dlp/extractor/webcaster.py b/yt_dlp/extractor/webcaster.py

index a858e992ca7684793a2835b53949252b447bd35e..b0865e3e684749cf8e6a66d616d03e235561205c 100644 (file)
--- a/yt_dlp/extractor/webcaster.py
+++ b/yt_dlp/extractor/webcaster.py
@@ -1,6 +1,3 @@
-# coding: utf-8
-from __future__ import unicode_literals
-
  import re
  
  from .common import InfoExtractor
@@ -38,7 +35,7 @@ def _real_extract(self, url):
          formats = []
          for format_id in (None, 'noise'):
              track_tag = join_nonempty('track', format_id, delim='_')
-            for track in video.findall('.//iphone/%s' % track_tag):
+            for track in video.findall(f'.//iphone/{track_tag}'):
                  track_url = track.text
                  if not track_url:
                      continue
@@ -53,7 +50,6 @@ def _real_extract(self, url):
                              'format_note': track.get('title'),
                          })
                      formats.extend(m3u8_formats)
-        self._sort_formats(formats)
  
          thumbnail = xpath_text(video, './/image', 'thumbnail')
  
@@ -67,27 +63,23 @@ def _real_extract(self, url):
  
  class WebcasterFeedIE(InfoExtractor):
      _VALID_URL = r'https?://bl\.webcaster\.pro/feed/start/free_(?P<id>[^/]+)'
+    _EMBED_REGEX = [r'<(?:object|a[^>]+class=["\']webcaster-player["\'])[^>]+data(?:-config)?=(["\']).*?config=(?P<url>https?://bl\.webcaster\.pro/feed/start/free_.*?)(?:[?&]|\1)']
      _TEST = {
          'url': 'http://bl.webcaster.pro/feed/start/free_c8cefd240aa593681c8d068cff59f407_hd/q393859/eb173f99dd5f558674dae55f4ba6806d/1480289104',
          'only_matching': True,
      }
  
-    @staticmethod
-    def _extract_url(ie, webpage):
-        mobj = re.search(
-            r'<(?:object|a[^>]+class=["\']webcaster-player["\'])[^>]+data(?:-config)?=(["\']).*?config=(?P<url>https?://bl\.webcaster\.pro/feed/start/free_.*?)(?:[?&]|\1)',
-            webpage)
-        if mobj:
-            return mobj.group('url')
+    def _extract_from_webpage(self, url, webpage):
+        yield from super()._extract_from_webpage(url, webpage)
+
          for secure in (True, False):
-            video_url = ie._og_search_video_url(
-                webpage, secure=secure, default=None)
+            video_url = self._og_search_video_url(webpage, secure=secure, default=None)
              if video_url:
                  mobj = re.search(
                      r'config=(?P<url>https?://bl\.webcaster\.pro/feed/start/free_[^?&=]+)',
                      video_url)
                  if mobj:
-                    return mobj.group('url')
+                    yield self.url_result(mobj.group('url'), self)
  
      def _real_extract(self, url):
          video_id = self._match_id(url)