[yt-dlp.git] / yt_dlp / extractor / bild.py

from .common import InfoExtractor
from ..utils import (
    int_or_none,
    unescapeHTML,
)


class BildIE(InfoExtractor):
    _VALID_URL = r'https?://(?:www\.)?bild\.de/(?:[^/]+/)+(?P<display_id>[^/]+)-(?P<id>\d+)(?:,auto=true)?\.bild\.html'
    IE_DESC = 'Bild.de'
    _TEST = {
        'url': 'http://www.bild.de/video/clip/apple-ipad-air/das-koennen-die-neuen-ipads-38184146.bild.html',
        'md5': 'dd495cbd99f2413502a1713a1156ac8a',
        'info_dict': {
            'id': '38184146',
            'ext': 'mp4',
            'title': 'Das können die  neuen iPads',
            'description': 'md5:a4058c4fa2a804ab59c00d7244bbf62f',
            'thumbnail': r're:^https?://.*\.jpg$',
            'duration': 196,
        }
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)

        video_data = self._download_json(
            url.split('.bild.html')[0] + ',view=json.bild.html', video_id)

        return {
            'id': video_id,
            'title': unescapeHTML(video_data['title']).strip(),
            'description': unescapeHTML(video_data.get('description')),
            'url': video_data['clipList'][0]['srces'][0]['src'],
            'thumbnail': video_data.get('poster'),
            'duration': int_or_none(video_data.get('durationSec')),
        }
Commit	Line	Data
b5a14350	1	from .common import InfoExtractor
c09593c0	2	from ..utils import (
bc08873c	3	int_or_none,
70cb4d51	4	unescapeHTML,
c09593c0	5	)
b5a14350 PH	6
	7
	8	class BildIE(InfoExtractor):
	9	_VALID_URL = r'https?://(?:www\.)?bild\.de/(?:[^/]+/)+(?P<display_id>[^/]+)-(?P<id>\d+)(?:,auto=true)?\.bild\.html'
	10	IE_DESC = 'Bild.de'
	11	_TEST = {
	12	'url': 'http://www.bild.de/video/clip/apple-ipad-air/das-koennen-die-neuen-ipads-38184146.bild.html',
	13	'md5': 'dd495cbd99f2413502a1713a1156ac8a',
	14	'info_dict': {
	15	'id': '38184146',
	16	'ext': 'mp4',
d8348c35 S	17	'title': 'Das können die neuen iPads',
d8348c35 S	18	'description': 'md5:a4058c4fa2a804ab59c00d7244bbf62f',
ec85ded8	19	'thumbnail': r're:^https?://.*\.jpg$',
b5a14350	20	'duration': 196,
b5a14350 PH	21	}
	22	}
	23
	24	def _real_extract(self, url):
	25	video_id = self._match_id(url)
	26
d8348c35 S	27	video_data = self._download_json(
d8348c35 S	28	url.split('.bild.html')[0] + ',view=json.bild.html', video_id)
b5a14350 PH	29
	30	return {
	31	'id': video_id,
d8348c35	32	'title': unescapeHTML(video_data['title']).strip(),
70cb4d51	33	'description': unescapeHTML(video_data.get('description')),
	34	'url': video_data['clipList'][0]['srces'][0]['src'],
	35	'thumbnail': video_data.get('poster'),
	36	'duration': int_or_none(video_data.get('durationSec')),
b5a14350	37	}