[extractor] Deprecate `_sort_formats`

[yt-dlp.git] / yt_dlp / extractor / tv2.py
diff --git a/yt_dlp/extractor/tv2.py b/yt_dlp/extractor/tv2.py

index b48dfe389f601456b260b25959d72a0963be4234..c51e63371286b496d26b05f7e42a4e2b187f9b80 100644 (file)
--- a/yt_dlp/extractor/tv2.py
+++ b/yt_dlp/extractor/tv2.py
@@ -1,6 +1,3 @@
-# coding: utf-8
-from __future__ import unicode_literals
-
  import re
  
  from .common import InfoExtractor
@@ -19,23 +16,27 @@
  
  
  class TV2IE(InfoExtractor):
-    _VALID_URL = r'https?://(?:www\.)?tv2\.no/v\d*/(?P<id>\d+)'
+    _VALID_URL = r'https?://(?:www\.)?tv2\.no/v(?:ideo)?\d*/(?:[^?#]+/)*(?P<id>\d+)'
      _TESTS = [{
-        'url': 'http://www.tv2.no/v/916509/',
+        'url': 'http://www.tv2.no/v/1791207/',
          'info_dict': {
-            'id': '916509',
+            'id': '1791207',
              'ext': 'mp4',
-            'title': 'Se Frode Gryttens hyllest av Steven Gerrard',
-            'description': 'TV 2 Sportens huspoet tar avskjed med Liverpools kaptein Steven Gerrard.',
-            'timestamp': 1431715610,
-            'upload_date': '20150515',
-            'duration': 157,
+            'title': 'Her kolliderer romsonden med asteroiden ',
+            'description': 'En romsonde har krasjet inn i en asteroide i verdensrommet. Kollisjonen skjedde klokken 01:14 natt til tirsdag 27. september norsk tid. \n\nNasa kaller det sitt første forsøk på planetforsvar.',
+            'timestamp': 1664238190,
+            'upload_date': '20220927',
+            'duration': 146,
+            'thumbnail': r're:^https://.*$',
              'view_count': int,
              'categories': list,
          },
      }, {
          'url': 'http://www.tv2.no/v2/916509',
          'only_matching': True,
+    }, {
+        'url': 'https://www.tv2.no/video/nyhetene/her-kolliderer-romsonden-med-asteroiden/1791207/',
+        'only_matching': True,
      }]
      _PROTOCOLS = ('HLS', 'DASH')
      _GEO_COUNTRIES = ['NO']
@@ -81,9 +82,7 @@ def _real_extract(self, url):
                  elif ext == 'm3u8':
                      if not data.get('drmProtected'):
                          formats.extend(self._extract_m3u8_formats(
-                            video_url, video_id, 'mp4',
-                            'm3u8' if is_live else 'm3u8_native',
-                            m3u8_id=format_id, fatal=False))
+                            video_url, video_id, 'mp4', live=is_live, m3u8_id=format_id, fatal=False))
                  elif ext == 'mpd':
                      formats.extend(self._extract_mpd_formats(
                          video_url, video_id, format_id, fatal=False))
@@ -96,7 +95,6 @@ def _real_extract(self, url):
                      })
          if not formats and data.get('drmProtected'):
              self.report_drm(video_id)
-        self._sort_formats(formats)
  
          thumbnails = [{
              'id': type,
@@ -119,13 +117,13 @@ def _real_extract(self, url):
  
  
  class TV2ArticleIE(InfoExtractor):
-    _VALID_URL = r'https?://(?:www\.)?tv2\.no/(?:a|\d{4}/\d{2}/\d{2}(/[^/]+)+)/(?P<id>\d+)'
+    _VALID_URL = r'https?://(?:www\.)?tv2\.no/(?!v(?:ideo)?\d*/)[^?#]+/(?P<id>\d+)'
      _TESTS = [{
-        'url': 'http://www.tv2.no/2015/05/16/nyheter/alesund/krim/pingvin/6930542',
+        'url': 'https://www.tv2.no/underholdning/forraeder/katarina-flatland-angrer-etter-forraeder-exit/15095188/',
          'info_dict': {
-            'id': '6930542',
-            'title': 'Russen hetses etter pingvintyveri - innrømmer å ha åpnet luken på buret',
-            'description': 'De fire siktede nekter fortsatt for å ha stjålet pingvinbabyene, men innrømmer å ha åpnet luken til de små kyllingene.',
+            'id': '15095188',
+            'title': 'Katarina Flatland angrer etter Forræder-exit',
+            'description': 'SANDEFJORD (TV 2): Katarina Flatland (33) måtte følge i sine fars fotspor, da hun ble forvist fra Forræder.',
          },
          'playlist_count': 2,
      }, {
@@ -143,7 +141,7 @@ def _real_extract(self, url):
  
          if not assets:
              # New embed pattern
-            for v in re.findall(r'(?s)TV2ContentboxVideo\(({.+?})\)', webpage):
+            for v in re.findall(r'(?s)(?:TV2ContentboxVideo|TV2\.TV2Video)\(({.+?})\)', webpage):
                  video = self._parse_json(
                      v, playlist_id, transform_source=js_to_json, fatal=False)
                  if not video:
@@ -244,9 +242,7 @@ def _real_extract(self, url):
                  elif ext == 'm3u8':
                      if not data.get('drmProtected'):
                          formats.extend(self._extract_m3u8_formats(
-                            video_url, video_id, 'mp4',
-                            'm3u8' if is_live else 'm3u8_native',
-                            m3u8_id=format_id, fatal=False))
+                            video_url, video_id, 'mp4', live=is_live, m3u8_id=format_id, fatal=False))
                  elif ext == 'mpd':
                      formats.extend(self._extract_mpd_formats(
                          video_url, video_id, format_id, fatal=False))
@@ -261,7 +257,6 @@ def _real_extract(self, url):
                      })
          if not formats and data.get('drmProtected'):
              self.report_drm(video_id)
-        self._sort_formats(formats)
  
          thumbnails = [{
              'id': thumbnail.get('@type'),