[doc] Minor improvements

[yt-dlp.git] / yt_dlp / extractor / youtube.py
diff --git a/yt_dlp/extractor/youtube.py b/yt_dlp/extractor/youtube.py

index e5097c2641aa50561780e84a63c9e776d36f2570..210e5b36cb07b35fba4e960038db996a874c1825 100644 (file)
--- a/yt_dlp/extractor/youtube.py
+++ b/yt_dlp/extractor/youtube.py
@@ -1,7 +1,3 @@
-# coding: utf-8
-
-from __future__ import unicode_literals
-
  import calendar
  import copy
  import datetime
@@ -14,9 +10,9 @@
  import random
  import re
  import sys
+import threading
  import time
  import traceback
-import threading
  
  from .common import InfoExtractor, SearchInfoExtractor
  from ..compat import (
@@ -31,12 +27,13 @@
  )
  from ..jsinterp import JSInterpreter
  from ..utils import (
+    NO_DEFAULT,
+    ExtractorError,
      bug_reports_message,
      clean_html,
      datetime_from_str,
      dict_get,
      error_to_compat_str,
-    ExtractorError,
      float_or_none,
      format_field,
      get_first,
@@ -46,7 +43,6 @@
      js_to_json,
      mimetype2ext,
      network_exceptions,
-    NO_DEFAULT,
      orderedSet,
      parse_codecs,
      parse_count,
@@ -72,7 +68,6 @@
      variadic,
  )
  
-
  # any clients starting with _ cannot be explicity requested by the user
  INNERTUBE_CLIENTS = {
      'web': {
@@ -217,15 +212,35 @@
              }
          },
          'INNERTUBE_CONTEXT_CLIENT_NAME': 2
-    }
+    },
+    # This client can access age restricted videos (unless the uploader has disabled the 'allow embedding' option)
+    # See: https://github.com/zerodytrash/YouTube-Internal-Clients
+    'tv_embedded': {
+        'INNERTUBE_API_KEY': 'AIzaSyAO_FJ2SlqU8Q4STEHLGCilw_Y9_11qcW8',
+        'INNERTUBE_CONTEXT': {
+            'client': {
+                'clientName': 'TVHTML5_SIMPLY_EMBEDDED_PLAYER',
+                'clientVersion': '2.0',
+            },
+        },
+        'INNERTUBE_CONTEXT_CLIENT_NAME': 85
+    },
  }
  
  
+def _split_innertube_client(client_name):
+    variant, *base = client_name.rsplit('.', 1)
+    if base:
+        return variant, base[0], variant
+    base, *variant = client_name.split('_', 1)
+    return client_name, base, variant[0] if variant else None
+
+
  def build_innertube_clients():
      THIRD_PARTY = {
-        'embedUrl': 'https://google.com',  # Can be any valid URL
+        'embedUrl': 'https://www.youtube.com/',  # Can be any valid URL
      }
-    BASE_CLIENTS = ('android', 'web', 'ios', 'mweb')
+    BASE_CLIENTS = ('android', 'web', 'tv', 'ios', 'mweb')
      priority = qualities(BASE_CLIENTS[::-1])
  
      for client, ytcfg in tuple(INNERTUBE_CLIENTS.items()):
@@ -234,15 +249,15 @@ def build_innertube_clients():
          ytcfg.setdefault('REQUIRE_JS_PLAYER', True)
          ytcfg['INNERTUBE_CONTEXT']['client'].setdefault('hl', 'en')
  
-        base_client, *variant = client.split('_')
+        _, base_client, variant = _split_innertube_client(client)
          ytcfg['priority'] = 10 * priority(base_client)
  
          if not variant:
-            INNERTUBE_CLIENTS[f'{client}_agegate'] = agegate_ytcfg = copy.deepcopy(ytcfg)
-            agegate_ytcfg['INNERTUBE_CONTEXT']['client']['clientScreen'] = 'EMBED'
-            agegate_ytcfg['INNERTUBE_CONTEXT']['thirdParty'] = THIRD_PARTY
-            agegate_ytcfg['priority'] -= 1
-        elif variant == ['embedded']:
+            INNERTUBE_CLIENTS[f'{client}_embedscreen'] = embedscreen = copy.deepcopy(ytcfg)
+            embedscreen['INNERTUBE_CONTEXT']['client']['clientScreen'] = 'EMBED'
+            embedscreen['INNERTUBE_CONTEXT']['thirdParty'] = THIRD_PARTY
+            embedscreen['priority'] -= 3
+        elif variant == 'embedded':
              ytcfg['INNERTUBE_CONTEXT']['thirdParty'] = THIRD_PARTY
              ytcfg['priority'] -= 2
          else:
@@ -272,7 +287,7 @@ class YoutubeBaseInfoExtractor(InfoExtractor):
          # invidious-redirect websites
          r'(?:www\.)?redirect\.invidious\.io',
          r'(?:(?:www|dev)\.)?invidio\.us',
-        # Invidious instances taken from https://github.com/iv-org/documentation/blob/master/Invidious-Instances.md
+        # Invidious instances taken from https://github.com/iv-org/documentation/blob/master/docs/instances.md
          r'(?:www\.)?invidious\.pussthecat\.org',
          r'(?:www\.)?invidious\.zee\.li',
          r'(?:www\.)?invidious\.ethibox\.fr',
@@ -364,6 +379,9 @@ def _initialize_pref(self):
      def _real_initialize(self):
          self._initialize_pref()
          self._initialize_consent()
+        self._check_login_required()
+
+    def _check_login_required(self):
          if (self._LOGIN_REQUIRED
                  and self.get_param('cookiefile') is None
                  and self.get_param('cookiesfrombrowser') is None):
@@ -429,7 +447,7 @@ def _generate_sapisidhash_header(self, origin='https://www.youtube.com'):
              return None
          # SAPISIDHASH algorithm from https://stackoverflow.com/a/32065323
          sapisidhash = hashlib.sha1(
-            f'{time_now} {self._SAPISID} {origin}'.encode('utf-8')).hexdigest()
+            f'{time_now} {self._SAPISID} {origin}'.encode()).hexdigest()
          return f'SAPISIDHASH {time_now}_{sapisidhash}'
  
      def _call_api(self, ep, query, video_id, fatal=True, headers=None,
@@ -443,14 +461,14 @@ def _call_api(self, ep, query, video_id, fatal=True, headers=None,
          if headers:
              real_headers.update(headers)
          return self._download_json(
-            'https://%s/youtubei/v1/%s' % (api_hostname or self._get_innertube_host(default_client), ep),
+            f'https://{api_hostname or self._get_innertube_host(default_client)}/youtubei/v1/{ep}',
              video_id=video_id, fatal=fatal, note=note, errnote=errnote,
              data=json.dumps(data).encode('utf8'), headers=real_headers,
              query={'key': api_key or self._extract_api_key(), 'prettyPrint': 'false'})
  
      def extract_yt_initial_data(self, item_id, webpage, fatal=True):
          data = self._search_regex(
-            (r'%s\s*%s' % (self._YT_INITIAL_DATA_RE, self._YT_INITIAL_BOUNDARY_RE),
+            (fr'{self._YT_INITIAL_DATA_RE}\s*{self._YT_INITIAL_BOUNDARY_RE}',
               self._YT_INITIAL_DATA_RE), webpage, 'yt initial data', fatal=fatal)
          if data:
              return self._parse_json(data, item_id, fatal=fatal)
@@ -543,6 +561,18 @@ def generate_api_headers(
              headers['X-Origin'] = origin
          return {h: v for h, v in headers.items() if v is not None}
  
+    def _download_ytcfg(self, client, video_id):
+        url = {
+            'web': 'https://www.youtube.com',
+            'web_music': 'https://music.youtube.com',
+            'web_embedded': f'https://www.youtube.com/embed/{video_id}?html5=1'
+        }.get(client)
+        if not url:
+            return {}
+        webpage = self._download_webpage(
+            url, video_id, fatal=False, note=f'Downloading {client.replace("_", " ").strip()} client config')
+        return self.extract_ytcfg(video_id, webpage) or {}
+
      @staticmethod
      def _build_api_continuation_query(continuation, ctp=None):
          query = {
@@ -622,7 +652,7 @@ def _report_alerts(self, alerts, expected=True, fatal=True, only_once=False):
                  warnings.append([alert_type, alert_message])
  
          for alert_type, alert_message in (warnings + errors[:-1]):
-            self.report_warning('YouTube said: %s - %s' % (alert_type, alert_message), only_once=only_once)
+            self.report_warning(f'YouTube said: {alert_type} - {alert_message}', only_once=only_once)
          if errors:
              raise ExtractorError('YouTube said: %s' % errors[-1][1], expected=expected)
  
@@ -708,6 +738,7 @@ def extract_relative_time(relative_time_text):
                  return None
  
      def _extract_time_text(self, renderer, *path_list):
+        """@returns (timestamp, time_text)"""
          text = self._get_text(renderer, *path_list) or ''
          dt = self.extract_relative_time(text)
          timestamp = None
@@ -817,17 +848,20 @@ def _extract_video(self, renderer):
  
          uploader = self._get_text(renderer, 'ownerText', 'shortBylineText')
          channel_id = traverse_obj(
-            renderer, ('shortBylineText', 'runs', ..., 'navigationEndpoint', 'browseEndpoint', 'browseId'), expected_type=str, get_all=False)
+            renderer, ('shortBylineText', 'runs', ..., 'navigationEndpoint', 'browseEndpoint', 'browseId'),
+            expected_type=str, get_all=False)
          timestamp, time_text = self._extract_time_text(renderer, 'publishedTimeText')
          scheduled_timestamp = str_to_int(traverse_obj(renderer, ('upcomingEventData', 'startTime'), get_all=False))
          overlay_style = traverse_obj(
-            renderer, ('thumbnailOverlays', ..., 'thumbnailOverlayTimeStatusRenderer', 'style'), get_all=False, expected_type=str)
+            renderer, ('thumbnailOverlays', ..., 'thumbnailOverlayTimeStatusRenderer', 'style'),
+            get_all=False, expected_type=str)
          badges = self._extract_badges(renderer)
          thumbnails = self._extract_thumbnails(renderer, 'thumbnail')
          navigation_url = urljoin('https://www.youtube.com/', traverse_obj(
-            renderer, ('navigationEndpoint', 'commandMetadata', 'webCommandMetadata', 'url'), expected_type=str))
+            renderer, ('navigationEndpoint', 'commandMetadata', 'webCommandMetadata', 'url'),
+            expected_type=str)) or ''
          url = f'https://www.youtube.com/watch?v={video_id}'
-        if overlay_style == 'SHORTS' or (navigation_url and '/shorts/' in navigation_url):
+        if overlay_style == 'SHORTS' or '/shorts/' in navigation_url:
              url = f'https://www.youtube.com/shorts/{video_id}'
  
          return {
@@ -842,7 +876,9 @@ def _extract_video(self, renderer):
              'uploader': uploader,
              'channel_id': channel_id,
              'thumbnails': thumbnails,
-            'upload_date': strftime_or_none(timestamp, '%Y%m%d') if self._configuration_arg('approximate_date', ie_key='youtubetab') else None,
+            'upload_date': (strftime_or_none(timestamp, '%Y%m%d')
+                            if self._configuration_arg('approximate_date', ie_key='youtubetab')
+                            else None),
              'live_status': ('is_upcoming' if scheduled_timestamp is not None
                              else 'was_live' if 'streamed' in time_text.lower()
                              else 'is_live' if overlay_style is not None and overlay_style == 'LIVE' or 'live now' in badges
@@ -2173,10 +2209,10 @@ def suitable(cls, url):
          qs = parse_qs(url)
          if qs.get('list', [None])[0]:
              return False
-        return super(YoutubeIE, cls).suitable(url)
+        return super().suitable(url)
  
      def __init__(self, *args, **kwargs):
-        super(YoutubeIE, self).__init__(*args, **kwargs)
+        super().__init__(*args, **kwargs)
          self._code_cache = {}
          self._player_cache = {}
  
@@ -2372,8 +2408,7 @@ def _extract_signature_function(self, video_id, player_url, example_sig):
          player_id = self._extract_player_info(player_url)
  
          # Read from filesystem cache
-        func_id = 'js_%s_%s' % (
-            player_id, self._signature_cache_id(example_sig))
+        func_id = f'js_{player_id}_{self._signature_cache_id(example_sig)}'
          assert os.path.basename(func_id) == func_id
  
          cache_spec = self._downloader.cache.load('youtube-sigfuncs', func_id)
@@ -2400,7 +2435,7 @@ def _genslice(start, end, step):
                  starts = '' if start == 0 else str(start)
                  ends = (':%d' % (end + step)) if end + step >= 0 else ':'
                  steps = '' if step == 1 else (':%d' % step)
-                return 's[%s%s%s]' % (starts, ends, steps)
+                return f's[{starts}{ends}{steps}]'
  
              step = None
              # Quelch pyflakes warnings - start will be set when step is set
@@ -2562,7 +2597,7 @@ def _mark_watched(self, video_id, player_responses):
          # cpn generation algorithm is reverse engineered from base.js.
          # In fact it works even with dummy cpn.
          CPN_ALPHABET = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789-_'
-        cpn = ''.join((CPN_ALPHABET[random.randint(0, 256) & 63] for _ in range(0, 16)))
+        cpn = ''.join(CPN_ALPHABET[random.randint(0, 256) & 63] for _ in range(0, 16))
  
          qs.update({
              'ver': ['2'],
@@ -2673,7 +2708,7 @@ def _extract_chapters(self, chapter_list, chapter_time, chapter_title, duration)
  
      def _extract_yt_initial_variable(self, webpage, regex, video_id, name):
          return self._parse_json(self._search_regex(
-            (r'%s\s*%s' % (regex, self._YT_INITIAL_BOUNDARY_RE),
+            (fr'{regex}\s*{self._YT_INITIAL_BOUNDARY_RE}',
               regex), webpage, name, default='{}'), video_id, fatal=False)
  
      def _extract_comment(self, comment_renderer, parent=None):
@@ -2771,8 +2806,8 @@ def extract_thread(contents):
                      comment_entries_iter = self._comment_entries(
                          comment_replies_renderer, ytcfg, video_id,
                          parent=comment.get('id'), tracker=tracker)
-                    for reply_comment in itertools.islice(comment_entries_iter, min(max_replies_per_thread, max(0, max_replies - tracker['total_reply_comments']))):
-                        yield reply_comment
+                    yield from itertools.islice(comment_entries_iter, min(
+                        max_replies_per_thread, max(0, max_replies - tracker['total_reply_comments'])))
  
          # Keeps track of counts across recursive calls
          if not tracker:
@@ -2914,7 +2949,7 @@ def _get_requested_clients(self, url, smuggled_data):
          requested_clients = []
          default = ['android', 'web']
          allowed_clients = sorted(
-            [client for client in INNERTUBE_CLIENTS.keys() if client[:1] != '_'],
+            (client for client in INNERTUBE_CLIENTS.keys() if client[:1] != '_'),
              key=lambda client: INNERTUBE_CLIENTS[client]['priority'], reverse=True)
          for client in self._configuration_arg('player_client'):
              if client in allowed_clients:
@@ -2934,16 +2969,6 @@ def _get_requested_clients(self, url, smuggled_data):
  
          return orderedSet(requested_clients)
  
-    def _extract_player_ytcfg(self, client, video_id):
-        url = {
-            'web_music': 'https://music.youtube.com',
-            'web_embedded': f'https://www.youtube.com/embed/{video_id}?html5=1'
-        }.get(client)
-        if not url:
-            return {}
-        webpage = self._download_webpage(url, video_id, fatal=False, note='Downloading %s config' % client.replace('_', ' ').strip())
-        return self.extract_ytcfg(video_id, webpage) or {}
-
      def _extract_player_responses(self, clients, video_id, webpage, master_ytcfg):
          initial_pr = None
          if webpage:
@@ -2956,13 +2981,14 @@ def _extract_player_responses(self, clients, video_id, webpage, master_ytcfg):
          prs = []
  
          def append_client(*client_names):
-            """ Append the first client name that exists """
+            """ Append the first client name that exists but not already used """
              for client_name in client_names:
-                if client_name in INNERTUBE_CLIENTS:
-                    if client_name not in all_clients:
+                actual_client = _split_innertube_client(client_name)[0]
+                if actual_client in INNERTUBE_CLIENTS:
+                    if actual_client not in all_clients:
                          clients.append(client_name)
-                        all_clients.add(client_name)
-                    return
+                        all_clients.add(actual_client)
+                        return
  
          # Android player_response does not have microFormats which are needed for
          # extraction of some data. So we return the initial_pr with formats
@@ -2977,10 +3003,10 @@ def append_client(*client_names):
          tried_iframe_fallback = False
          player_url = None
          while clients:
-            client = clients.pop()
+            client, base_client, variant = _split_innertube_client(clients.pop())
              player_ytcfg = master_ytcfg if client == 'web' else {}
-            if 'configs' not in self._configuration_arg('player_skip'):
-                player_ytcfg = self._extract_player_ytcfg(client, video_id) or player_ytcfg
+            if 'configs' not in self._configuration_arg('player_skip') and client != 'web':
+                player_ytcfg = self._download_ytcfg(client, video_id) or player_ytcfg
  
              player_url = player_url or self._extract_player_url(master_ytcfg, player_ytcfg, webpage=webpage)
              require_js_player = self._get_default_ytcfg(client).get('REQUIRE_JS_PLAYER')
@@ -3005,10 +3031,13 @@ def append_client(*client_names):
                  prs.append(pr)
  
              # creator clients can bypass AGE_VERIFICATION_REQUIRED if logged in
-            if client.endswith('_agegate') and self._is_unplayable(pr) and self.is_authenticated:
-                append_client(client.replace('_agegate', '_creator'))
+            if variant == 'embedded' and self._is_unplayable(pr) and self.is_authenticated:
+                append_client(f'{base_client}_creator')
              elif self._is_agegated(pr):
-                append_client(f'{client}_embedded', f'{client.replace("_embedded", "")}_agegate')
+                if variant == 'tv_embedded':
+                    append_client(f'{base_client}_embedded')
+                elif not variant:
+                    append_client(f'tv_embedded.{base_client}', f'{base_client}_embedded')
  
          if last_error:
              if not len(prs):
@@ -3557,17 +3586,17 @@ def process_language(container, base_url, lang_code, sub_name, query):
                  headers=self.generate_api_headers(ytcfg=master_ytcfg),
                  note='Downloading initial data API JSON')
  
-        try:
-            # This will error if there is no livechat
+        try:  # This will error if there is no livechat
              initial_data['contents']['twoColumnWatchNextResults']['conversationBar']['liveChatRenderer']['continuations'][0]['reloadContinuationData']['continuation']
+        except (KeyError, IndexError, TypeError):
+            pass
+        else:
              info.setdefault('subtitles', {})['live_chat'] = [{
-                'url': 'https://www.youtube.com/watch?v=%s' % video_id,  # url is needed to set cookies
+                'url': f'https://www.youtube.com/watch?v={video_id}',  # url is needed to set cookies
                  'video_id': video_id,
                  'ext': 'json',
                  'protocol': 'youtube_live_chat' if is_live or is_upcoming else 'youtube_live_chat_replay',
              }]
-        except (KeyError, IndexError, TypeError):
-            pass
  
          if initial_data:
              info['chapters'] = (
@@ -3589,7 +3618,7 @@ def process_language(container, base_url, lang_code, sub_name, query):
                          lambda x: x['superTitleIcon']['iconType']) == 'LOCATION_PIN':
                      info['location'] = stl
                  else:
-                    mobj = re.search(r'(.+?)\s*S(\d+)\s*•\s*E(\d+)', stl)
+                    mobj = re.search(r'(.+?)\s*S(\d+)\s*•?\s*E(\d+)', stl)
                      if mobj:
                          info.update({
                              'series': mobj.group(1),
@@ -3753,7 +3782,7 @@ def _extract_channel_id(self, webpage):
      def _extract_basic_item_renderer(item):
          # Modified from _extract_grid_item_renderer
          known_basic_renderers = (
-            'playlistRenderer', 'videoRenderer', 'channelRenderer', 'showRenderer'
+            'playlistRenderer', 'videoRenderer', 'channelRenderer', 'showRenderer', 'reelItemRenderer'
          )
          for key, renderer in item.items():
              if not isinstance(renderer, dict):
@@ -3830,8 +3859,7 @@ def _shelf_entries_from_content(self, shelf_renderer):
              # TODO: add support for nested playlists so each shelf is processed
              # as separate playlist
              # TODO: this includes only first N items
-            for entry in self._grid_entries(renderer):
-                yield entry
+            yield from self._grid_entries(renderer)
          renderer = content.get('horizontalListRenderer')
          if renderer:
              # TODO
@@ -3851,8 +3879,7 @@ def _shelf_entries(self, shelf_renderer, skip_channels=False):
              title = self._get_text(shelf_renderer, 'title')
              yield self.url_result(shelf_url, video_title=title)
          # Shelf may not contain shelf URL, fallback to extraction from content
-        for entry in self._shelf_entries_from_content(shelf_renderer):
-            yield entry
+        yield from self._shelf_entries_from_content(shelf_renderer)
  
      def _playlist_entries(self, video_list_renderer):
          for content in video_list_renderer['contents']:
@@ -3879,6 +3906,13 @@ def _video_entry(self, video_renderer):
          if video_id:
              return self._extract_video(video_renderer)
  
+    def _hashtag_tile_entry(self, hashtag_tile_renderer):
+        url = urljoin('https://youtube.com', traverse_obj(
+            hashtag_tile_renderer, ('onTapCommand', 'commandMetadata', 'webCommandMetadata', 'url')))
+        if url:
+            return self.url_result(
+                url, ie=YoutubeTabIE.ie_key(), title=self._get_text(hashtag_tile_renderer, 'hashtag'))
+
      def _post_thread_entries(self, post_thread_renderer):
          post_renderer = try_get(
              post_thread_renderer, lambda x: x['post']['backstagePostRenderer'], dict)
@@ -3923,8 +3957,7 @@ def _post_thread_continuation_entries(self, post_thread_continuation):
              renderer = content.get('backstagePostThreadRenderer')
              if not isinstance(renderer, dict):
                  continue
-            for entry in self._post_thread_entries(renderer):
-                yield entry
+            yield from self._post_thread_entries(renderer)
  
      r''' # unused
      def _rich_grid_entries(self, contents):
@@ -3961,12 +3994,14 @@ def _extract_entries(self, parent_renderer, continuation_list):
                  known_renderers = {
                      'playlistVideoListRenderer': self._playlist_entries,
                      'gridRenderer': self._grid_entries,
-                    'shelfRenderer': lambda x: self._shelf_entries(x),
+                    'reelShelfRenderer': self._grid_entries,
+                    'shelfRenderer': self._shelf_entries,
                      'musicResponsiveListItemRenderer': lambda x: [self._music_reponsive_list_entry(x)],
                      'backstagePostThreadRenderer': self._post_thread_entries,
                      'videoRenderer': lambda x: [self._video_entry(x)],
                      'playlistRenderer': lambda x: self._grid_entries({'items': [{'playlistRenderer': x}]}),
                      'channelRenderer': lambda x: self._grid_entries({'items': [{'channelRenderer': x}]}),
+                    'hashtagTileRenderer': lambda x: [self._hashtag_tile_entry(x)]
                  }
                  for key, renderer in isr_content.items():
                      if key not in known_renderers:
@@ -3992,8 +4027,7 @@ def _entries(self, tab, item_id, ytcfg, account_syncid, visitor_data):
          parent_renderer = (
              try_get(tab_content, lambda x: x['sectionListRenderer'], dict)
              or try_get(tab_content, lambda x: x['richGridRenderer'], dict) or {})
-        for entry in extract_entries(parent_renderer):
-            yield entry
+        yield from extract_entries(parent_renderer)
          continuation = continuation_list[0]
  
          for page_num in itertools.count(1):
@@ -4002,7 +4036,7 @@ def _entries(self, tab, item_id, ytcfg, account_syncid, visitor_data):
              headers = self.generate_api_headers(
                  ytcfg=ytcfg, account_syncid=account_syncid, visitor_data=visitor_data)
              response = self._extract_response(
-                item_id='%s page %s' % (item_id, page_num),
+                item_id=f'{item_id} page {page_num}',
                  query=continuation, headers=headers, ytcfg=ytcfg,
                  check_get_keys=('continuationContents', 'onResponseReceivedActions', 'onResponseReceivedEndpoints'))
  
@@ -4026,8 +4060,7 @@ def _entries(self, tab, item_id, ytcfg, account_syncid, visitor_data):
                      continue
                  continuation_renderer = value
                  continuation_list = [None]
-                for entry in known_continuation_renderers[key](continuation_renderer):
-                    yield entry
+                yield from known_continuation_renderers[key](continuation_renderer)
                  continuation = continuation_list[0] or self._extract_continuation(continuation_renderer)
                  break
              if continuation_renderer:
@@ -4053,8 +4086,7 @@ def _entries(self, tab, item_id, ytcfg, account_syncid, visitor_data):
                      continue
                  video_items_renderer = {known_renderers[key][1]: continuation_items}
                  continuation_list = [None]
-                for entry in known_renderers[key][0](video_items_renderer):
-                    yield entry
+                yield from known_renderers[key][0](video_items_renderer)
                  continuation = continuation_list[0] or self._extract_continuation(video_items_renderer)
                  break
              if video_items_renderer:
@@ -4071,14 +4103,15 @@ def _extract_selected_tab(tabs, fatal=True):
              if fatal:
                  raise ExtractorError('Unable to find selected tab')
  
-    @classmethod
-    def _extract_uploader(cls, data):
+    def _extract_uploader(self, data):
          uploader = {}
-        renderer = cls._extract_sidebar_info_renderer(data, 'playlistSidebarSecondaryInfoRenderer') or {}
+        renderer = self._extract_sidebar_info_renderer(data, 'playlistSidebarSecondaryInfoRenderer') or {}
          owner = try_get(
              renderer, lambda x: x['videoOwner']['videoOwnerRenderer']['title']['runs'][0], dict)
          if owner:
-            uploader['uploader'] = owner.get('text')
+            owner_text = owner.get('text')
+            uploader['uploader'] = self._search_regex(
+                r'^by (.+) and \d+ others?$', owner_text, 'uploader', default=owner_text)
              uploader['uploader_id'] = try_get(
                  owner, lambda x: x['navigationEndpoint']['browseEndpoint']['browseId'], compat_str)
              uploader['uploader_url'] = urljoin(
@@ -4138,7 +4171,7 @@ def _get_uncropped(url):
                  })
  
          primary_thumbnails = self._extract_thumbnails(
-            primary_sidebar_renderer, ('thumbnailRenderer', 'playlistVideoThumbnailRenderer', 'thumbnail'))
+            primary_sidebar_renderer, ('thumbnailRenderer', ('playlistVideoThumbnailRenderer', 'playlistCustomThumbnailRenderer'), 'thumbnail'))
  
          if playlist_id is None:
              playlist_id = item_id
@@ -4308,6 +4341,10 @@ def _reload_with_unavailable_videos(self, item_id, data, ytcfg):
              check_get_keys='contents', fatal=False, ytcfg=ytcfg,
              note='Downloading API JSON with unavailable videos')
  
+    @property
+    def skip_webpage(self):
+        return 'webpage' in self._configuration_arg('skip', ie_key=YoutubeTabIE.ie_key())
+
      def _extract_webpage(self, url, item_id, fatal=True):
          retries = self.get_param('extractor_retries', 3)
          count = -1
@@ -4354,9 +4391,21 @@ def _extract_webpage(self, url, item_id, fatal=True):
  
          return webpage, data
  
+    def _report_playlist_authcheck(self, ytcfg, fatal=True):
+        """Use if failed to extract ytcfg (and data) from initial webpage"""
+        if not ytcfg and self.is_authenticated:
+            msg = 'Playlists that require authentication may not extract correctly without a successful webpage download'
+            if 'authcheck' not in self._configuration_arg('skip', ie_key=YoutubeTabIE.ie_key()) and fatal:
+                raise ExtractorError(
+                    f'{msg}. If you are not downloading private content, or '
+                    'your cookies are only for the first account and channel,'
+                    ' pass "--extractor-args youtubetab:skip=authcheck" to skip this check',
+                    expected=True)
+            self.report_warning(msg, only_once=True)
+
      def _extract_data(self, url, item_id, ytcfg=None, fatal=True, webpage_fatal=False, default_client='web'):
          data = None
-        if 'webpage' not in self._configuration_arg('skip'):
+        if not self.skip_webpage:
              webpage, data = self._extract_webpage(url, item_id, fatal=webpage_fatal)
              ytcfg = ytcfg or self.extract_ytcfg(item_id, webpage)
              # Reject webpage data if redirected to home page without explicitly requesting
@@ -4370,14 +4419,7 @@ def _extract_data(self, url, item_id, ytcfg=None, fatal=True, webpage_fatal=Fals
                      raise ExtractorError(msg, expected=True)
                  self.report_warning(msg, only_once=True)
          if not data:
-            if not ytcfg and self.is_authenticated:
-                msg = 'Playlists that require authentication may not extract correctly without a successful webpage download.'
-                if 'authcheck' not in self._configuration_arg('skip') and fatal:
-                    raise ExtractorError(
-                        msg + ' If you are not downloading private content, or your cookies are only for the first account and channel,'
-                              ' pass "--extractor-args youtubetab:skip=authcheck" to skip this check',
-                        expected=True)
-                self.report_warning(msg, only_once=True)
+            self._report_playlist_authcheck(ytcfg, fatal=fatal)
              data = self._extract_tab_endpoint(url, item_id, ytcfg, fatal=fatal, default_client=default_client)
          return data, ytcfg
  
@@ -4415,14 +4457,20 @@ def _search_results(self, query, params=NO_DEFAULT, default_client='web'):
              ('contents', 'tabbedSearchResultsRenderer', 'tabs', 0, 'tabRenderer', 'content', 'sectionListRenderer', 'contents'),
              ('continuationContents', ),
          )
-        check_get_keys = tuple(set(keys[0] for keys in content_keys))
+        display_id = f'query "{query}"'
+        check_get_keys = tuple({keys[0] for keys in content_keys})
+        ytcfg = self._download_ytcfg(default_client, display_id) if not self.skip_webpage else {}
+        self._report_playlist_authcheck(ytcfg, fatal=False)
  
          continuation_list = [None]
+        search = None
          for page_num in itertools.count(1):
              data.update(continuation_list[0] or {})
+            headers = self.generate_api_headers(
+                ytcfg=ytcfg, visitor_data=self._extract_visitor_data(search), default_client=default_client)
              search = self._extract_response(
-                item_id='query "%s" page %s' % (query, page_num), ep='search', query=data,
-                default_client=default_client, check_get_keys=check_get_keys)
+                item_id=f'{display_id} page {page_num}', ep='search', query=data,
+                default_client=default_client, check_get_keys=check_get_keys, ytcfg=ytcfg, headers=headers)
              slr_contents = traverse_obj(search, *content_keys)
              yield from self._extract_entries({'contents': list(variadic(slr_contents))}, continuation_list)
              if not continuation_list[0]:
@@ -5098,12 +5146,29 @@ class YoutubeTabIE(YoutubeTabBaseInfoExtractor):
          'note': 'non-standard redirect to regional channel',
          'url': 'https://www.youtube.com/channel/UCwVVpHQ2Cs9iGJfpdFngePQ',
          'only_matching': True
+    }, {
+        'note': 'collaborative playlist (uploader name in the form "by <uploader> and x other(s)")',
+        'url': 'https://www.youtube.com/playlist?list=PLx-_-Kk4c89oOHEDQAojOXzEzemXxoqx6',
+        'info_dict': {
+            'id': 'PLx-_-Kk4c89oOHEDQAojOXzEzemXxoqx6',
+            'modified_date': '20220407',
+            'channel_url': 'https://www.youtube.com/channel/UCKcqXmCcyqnhgpA5P0oHH_Q',
+            'tags': [],
+            'uploader_id': 'UCKcqXmCcyqnhgpA5P0oHH_Q',
+            'uploader': 'pukkandan',
+            'availability': 'unlisted',
+            'channel_id': 'UCKcqXmCcyqnhgpA5P0oHH_Q',
+            'channel': 'pukkandan',
+            'description': 'Test for collaborative playlist',
+            'title': 'yt-dlp test - collaborative playlist',
+            'uploader_url': 'https://www.youtube.com/channel/UCKcqXmCcyqnhgpA5P0oHH_Q',
+        },
+        'playlist_mincount': 2
      }]
  
      @classmethod
      def suitable(cls, url):
-        return False if YoutubeIE.suitable(url) else super(
-            YoutubeTabIE, cls).suitable(url)
+        return False if YoutubeIE.suitable(url) else super().suitable(url)
  
      _URL_RE = re.compile(rf'(?P<pre>{_VALID_URL})(?(not_channel)|(?P<tab>/\w+))?(?P<post>.*)$')
  
@@ -5150,7 +5215,7 @@ def get_mobj(url):
  
          # Handle both video/playlist URLs
          qs = parse_qs(url)
-        video_id, playlist_id = [qs.get(key, [None])[0] for key in ('v', 'list')]
+        video_id, playlist_id = (qs.get(key, [None])[0] for key in ('v', 'list'))
  
          if not video_id and mobj['not_channel'].startswith('watch'):
              if not playlist_id:
@@ -5336,7 +5401,7 @@ def suitable(cls, url):
          qs = parse_qs(url)
          if qs.get('v', [None])[0]:
              return False
-        return super(YoutubePlaylistIE, cls).suitable(url)
+        return super().suitable(url)
  
      def _real_extract(self, url):
          playlist_id = self._match_id(url)
@@ -5448,6 +5513,95 @@ def _real_extract(self, url):
              ie=YoutubeTabIE.ie_key())
  
  
+class YoutubeNotificationsIE(YoutubeTabBaseInfoExtractor):
+    IE_NAME = 'youtube:notif'
+    IE_DESC = 'YouTube notifications; ":ytnotif" keyword (requires cookies)'
+    _VALID_URL = r':ytnotif(?:ication)?s?'
+    _LOGIN_REQUIRED = True
+    _TESTS = [{
+        'url': ':ytnotif',
+        'only_matching': True,
+    }, {
+        'url': ':ytnotifications',
+        'only_matching': True,
+    }]
+
+    def _extract_notification_menu(self, response, continuation_list):
+        notification_list = traverse_obj(
+            response,
+            ('actions', 0, 'openPopupAction', 'popup', 'multiPageMenuRenderer', 'sections', 0, 'multiPageMenuNotificationSectionRenderer', 'items'),
+            ('actions', 0, 'appendContinuationItemsAction', 'continuationItems'),
+            expected_type=list) or []
+        continuation_list[0] = None
+        for item in notification_list:
+            entry = self._extract_notification_renderer(item.get('notificationRenderer'))
+            if entry:
+                yield entry
+            continuation = item.get('continuationItemRenderer')
+            if continuation:
+                continuation_list[0] = continuation
+
+    def _extract_notification_renderer(self, notification):
+        video_id = traverse_obj(
+            notification, ('navigationEndpoint', 'watchEndpoint', 'videoId'), expected_type=str)
+        url = f'https://www.youtube.com/watch?v={video_id}'
+        channel_id = None
+        if not video_id:
+            browse_ep = traverse_obj(
+                notification, ('navigationEndpoint', 'browseEndpoint'), expected_type=dict)
+            channel_id = traverse_obj(browse_ep, 'browseId', expected_type=str)
+            post_id = self._search_regex(
+                r'/post/(.+)', traverse_obj(browse_ep, 'canonicalBaseUrl', expected_type=str),
+                'post id', default=None)
+            if not channel_id or not post_id:
+                return
+            # The direct /post url redirects to this in the browser
+            url = f'https://www.youtube.com/channel/{channel_id}/community?lb={post_id}'
+
+        channel = traverse_obj(
+            notification, ('contextualMenu', 'menuRenderer', 'items', 1, 'menuServiceItemRenderer', 'text', 'runs', 1, 'text'),
+            expected_type=str)
+        title = self._search_regex(
+            rf'{re.escape(channel)} [^:]+: (.+)', self._get_text(notification, 'shortMessage'),
+            'video title', default=None)
+        if title:
+            title = title.replace('\xad', '')  # remove soft hyphens
+        upload_date = (strftime_or_none(self._extract_time_text(notification, 'sentTimeText')[0], '%Y%m%d')
+                       if self._configuration_arg('approximate_date', ie_key=YoutubeTabIE.ie_key())
+                       else None)
+        return {
+            '_type': 'url',
+            'url': url,
+            'ie_key': (YoutubeIE if video_id else YoutubeTabIE).ie_key(),
+            'video_id': video_id,
+            'title': title,
+            'channel_id': channel_id,
+            'channel': channel,
+            'thumbnails': self._extract_thumbnails(notification, 'videoThumbnail'),
+            'upload_date': upload_date,
+        }
+
+    def _notification_menu_entries(self, ytcfg):
+        continuation_list = [None]
+        response = None
+        for page in itertools.count(1):
+            ctoken = traverse_obj(
+                continuation_list, (0, 'continuationEndpoint', 'getNotificationMenuEndpoint', 'ctoken'), expected_type=str)
+            response = self._extract_response(
+                item_id=f'page {page}', query={'ctoken': ctoken} if ctoken else {}, ytcfg=ytcfg,
+                ep='notification/get_notification_menu', check_get_keys='actions',
+                headers=self.generate_api_headers(ytcfg=ytcfg, visitor_data=self._extract_visitor_data(response)))
+            yield from self._extract_notification_menu(response, continuation_list)
+            if not continuation_list[0]:
+                break
+
+    def _real_extract(self, url):
+        display_id = 'notifications'
+        ytcfg = self._download_ytcfg('web', display_id) if not self.skip_webpage else {}
+        self._report_playlist_authcheck(ytcfg)
+        return self.playlist_result(self._notification_menu_entries(ytcfg), display_id, display_id)
+
+
  class YoutubeSearchIE(YoutubeTabBaseInfoExtractor, SearchInfoExtractor):
      IE_DESC = 'YouTube search'
      IE_NAME = 'youtube:search'
@@ -5496,7 +5650,17 @@ class YoutubeSearchURLIE(YoutubeTabBaseInfoExtractor):
              'id': 'python',
              'title': 'python',
          }
-
+    }, {
+        'url': 'https://www.youtube.com/results?search_query=%23cats',
+        'playlist_mincount': 1,
+        'info_dict': {
+            'id': '#cats',
+            'title': '#cats',
+            'entries': [{
+                'url': r're:https://(www\.)?youtube\.com/hashtag/cats',
+                'title': '#cats',
+            }],
+        },
      }, {
          'url': 'https://www.youtube.com/results?q=test&sp=EgQIBBgB',
          'only_matching': True,
@@ -5567,7 +5731,9 @@ class YoutubeFeedsInfoExtractor(InfoExtractor):
      Subclasses must define the _FEED_NAME property.
      """
      _LOGIN_REQUIRED = True
-    _TESTS = []
+
+    def _real_initialize(self):
+        YoutubeBaseInfoExtractor._check_login_required(self)
  
      @property
      def IE_NAME(self):
@@ -5704,5 +5870,5 @@ class YoutubeTruncatedIDIE(InfoExtractor):
      def _real_extract(self, url):
          video_id = self._match_id(url)
          raise ExtractorError(
-            'Incomplete YouTube ID %s. URL %s looks truncated.' % (video_id, url),
+            f'Incomplete YouTube ID {video_id}. URL {url} looks truncated.',
              expected=True)