[utils] Add `join_nonempty`

[yt-dlp.git] / yt_dlp / extractor / srgssr.py
diff --git a/yt_dlp/extractor/srgssr.py b/yt_dlp/extractor/srgssr.py

index ac018e7405f966aa19e6962715bf6ddaa1feced8..f9919816d49c65476a99dd2d429533799a82dd13 100644 (file)
--- a/yt_dlp/extractor/srgssr.py
+++ b/yt_dlp/extractor/srgssr.py
@@ -1,13 +1,13 @@
  # coding: utf-8
  from __future__ import unicode_literals
  
-import re
  
  from .common import InfoExtractor
  from ..utils import (
      ExtractorError,
      float_or_none,
      int_or_none,
+    join_nonempty,
      parse_iso8601,
      qualities,
      try_get,
@@ -82,11 +82,12 @@ def _get_media_data(self, bu, media_type, media_id):
          return media_data
  
      def _real_extract(self, url):
-        bu, media_type, media_id = re.match(self._VALID_URL, url).groups()
+        bu, media_type, media_id = self._match_valid_url(url).groups()
          media_data = self._get_media_data(bu, media_type, media_id)
          title = media_data['title']
  
          formats = []
+        subtitles = {}
          q = qualities(['SD', 'HD'])
          for source in (media_data.get('resourceList') or []):
              format_url = source.get('url')
@@ -94,22 +95,22 @@ def _real_extract(self, url):
                  continue
              protocol = source.get('protocol')
              quality = source.get('quality')
-            format_id = []
-            for e in (protocol, source.get('encoding'), quality):
-                if e:
-                    format_id.append(e)
-            format_id = '-'.join(format_id)
+            format_id = join_nonempty(protocol, source.get('encoding'), quality)
  
              if protocol in ('HDS', 'HLS'):
                  if source.get('tokenType') == 'AKAMAI':
                      format_url = self._get_tokenized_src(
                          format_url, media_id, format_id)
-                    formats.extend(self._extract_akamai_formats(
-                        format_url, media_id))
+                    fmts, subs = self._extract_akamai_formats_and_subtitles(
+                        format_url, media_id)
+                    formats.extend(fmts)
+                    subtitles = self._merge_subtitles(subtitles, subs)
                  elif protocol == 'HLS':
-                    formats.extend(self._extract_m3u8_formats(
+                    m3u8_fmts, m3u8_subs = self._extract_m3u8_formats_and_subtitles(
                          format_url, media_id, 'mp4', 'm3u8_native',
-                        m3u8_id=format_id, fatal=False))
+                        m3u8_id=format_id, fatal=False)
+                    formats.extend(m3u8_fmts)
+                    subtitles = self._merge_subtitles(subtitles, m3u8_subs)
              elif protocol in ('HTTP', 'HTTPS'):
                  formats.append({
                      'format_id': format_id,
@@ -133,7 +134,6 @@ def _real_extract(self, url):
                  })
          self._sort_formats(formats)
  
-        subtitles = {}
          if media_type == 'video':
              for sub in (media_data.get('subtitleList') or []):
                  sub_url = sub.get('url')
@@ -245,7 +245,7 @@ class SRGSSRPlayIE(InfoExtractor):
      }]
  
      def _real_extract(self, url):
-        mobj = re.match(self._VALID_URL, url)
+        mobj = self._match_valid_url(url)
          bu = mobj.group('bu')
          media_type = mobj.group('type') or mobj.group('type_2')
          media_id = mobj.group('id')