yt_dlp/extractor/rozhlas.py

   1 from .common import InfoExtractor
   2 from ..utils import (
   3     int_or_none,
   4     remove_start,
   5 )
   6
   7
   8 class RozhlasIE(InfoExtractor):
   9     _VALID_URL = r'https?://(?:www\.)?prehravac\.rozhlas\.cz/audio/(?P<id>[0-9]+)'
  10     _TESTS = [{
  11         'url': 'http://prehravac.rozhlas.cz/audio/3421320',
  12         'md5': '504c902dbc9e9a1fd50326eccf02a7e2',
  13         'info_dict': {
  14             'id': '3421320',
  15             'ext': 'mp3',
  16             'title': 'Echo Pavla Klusáka (30.06.2015 21:00)',
  17             'description': 'Osmdesátiny Terryho Rileyho jsou skvělou příležitostí proletět se elektronickými i akustickými díly zakladatatele minimalismu, který je aktivní už přes padesát let'
  18         }
  19     }, {
  20         'url': 'http://prehravac.rozhlas.cz/audio/3421320/embed',
  21         'only_matching': True,
  22     }]
  23
  24     def _real_extract(self, url):
  25         audio_id = self._match_id(url)
  26
  27         webpage = self._download_webpage(
  28             'http://prehravac.rozhlas.cz/audio/%s' % audio_id, audio_id)
  29
  30         title = self._html_search_regex(
  31             r'<h3>(.+?)</h3>\s*<p[^>]*>.*?</p>\s*<div[^>]+id=["\']player-track',
  32             webpage, 'title', default=None) or remove_start(
  33             self._og_search_title(webpage), 'Radio Wave - ')
  34         description = self._html_search_regex(
  35             r'<p[^>]+title=(["\'])(?P<url>(?:(?!\1).)+)\1[^>]*>.*?</p>\s*<div[^>]+id=["\']player-track',
  36             webpage, 'description', fatal=False, group='url')
  37         duration = int_or_none(self._search_regex(
  38             r'data-duration=["\'](\d+)', webpage, 'duration', default=None))
  39
  40         return {
  41             'id': audio_id,
  42             'url': 'http://media.rozhlas.cz/_audio/%s.mp3' % audio_id,
  43             'title': title,
  44             'description': description,
  45             'duration': duration,
  46             'vcodec': 'none',
  47         }