[yt-dlp.git] / youtube_dl / extractor / amp.py

# coding: utf-8
from __future__ import unicode_literals

from .common import InfoExtractor
from ..utils import (
    int_or_none,
    parse_iso8601,
)


class AMPIE(InfoExtractor):
    # parse Akamai Adaptive Media Player feed
    def _extract_feed_info(self, url):
        item = self._download_json(
            url, None, 'Downloading Akamai AMP feed',
            'Unable to download Akamai AMP feed')['channel']['item']

        video_id = item['guid']

        def get_media_node(name, default=None):
            media_name = 'media-%s' % name
            media_group = item.get('media-group') or item
            return media_group.get(media_name) or item.get(media_name) or item.get(name, default)

        thumbnails = []
        media_thumbnail = get_media_node('thumbnail')
        if media_thumbnail:
            if isinstance(media_thumbnail, dict):
                media_thumbnail = [media_thumbnail]
            for thumbnail_data in media_thumbnail:
                thumbnail = thumbnail_data['@attributes']
                thumbnails.append({
                    'url': self._proto_relative_url(thumbnail['url'], 'http:'),
                    'width': int_or_none(thumbnail.get('width')),
                    'height': int_or_none(thumbnail.get('height')),
                })

        subtitles = {}
        media_subtitle = get_media_node('subTitle')
        if media_subtitle:
            if isinstance(media_subtitle, dict):
                media_subtitle = [media_subtitle]
            for subtitle_data in media_subtitle:
                subtitle = subtitle_data['@attributes']
                lang = subtitle.get('lang') or 'en'
                subtitles[lang] = [{'url': subtitle['href']}]

        formats = []
        media_content = get_media_node('content')
        if isinstance(media_content, dict):
            media_content = [media_content]
        for media_data in media_content:
            media = media_data['@attributes']
            media_type = media['type']
            if media_type == 'video/f4m':
                formats.extend(self._extract_f4m_formats(
                    media['url'] + '?hdcore=3.4.0&plugin=aasp-3.4.0.132.124',
                    video_id, f4m_id='hds', fatal=False))
            elif media_type == 'application/x-mpegURL':
                formats.extend(self._extract_m3u8_formats(
                    media['url'], video_id, 'mp4', m3u8_id='hls', fatal=False))
            else:
                formats.append({
                    'format_id': media_data['media-category']['@attributes']['label'],
                    'url': media['url'],
                    'tbr': int_or_none(media.get('bitrate')),
                    'filesize': int_or_none(media.get('fileSize')),
                })

        self._sort_formats(formats)

        return {
            'id': video_id,
            'title': get_media_node('title'),
            'description': get_media_node('description'),
            'thumbnails': thumbnails,
            'timestamp': parse_iso8601(item.get('pubDate'), ' '),
            'duration': int_or_none(media_content[0].get('@attributes', {}).get('duration')),
            'formats': formats,
        }
Commit	Line	Data
3793090b	1	# coding: utf-8
	2	from __future__ import unicode_literals
	3
	4	from .common import InfoExtractor
	5	from ..utils import (
	6	int_or_none,
	7	parse_iso8601,
	8	)
	9
	10
	11	class AMPIE(InfoExtractor):
3793090b	12	# parse Akamai Adaptive Media Player feed
	13	def _extract_feed_info(self, url):
	14	item = self._download_json(
c7fa5fa4	15	url, None, 'Downloading Akamai AMP feed',
c7fa5fa4	16	'Unable to download Akamai AMP feed')['channel']['item']
3793090b	17
3793090b	18	video_id = item['guid']
c7fa5fa4	19
	20	def get_media_node(name, default=None):
	21	media_name = 'media-%s' % name
	22	media_group = item.get('media-group') or item
	23	return media_group.get(media_name) or item.get(media_name) or item.get(name, default)
	24
3793090b	25	thumbnails = []
c7fa5fa4	26	media_thumbnail = get_media_node('thumbnail')
3793090b	27	if media_thumbnail:
	28	if isinstance(media_thumbnail, dict):
	29	media_thumbnail = [media_thumbnail]
	30	for thumbnail_data in media_thumbnail:
	31	thumbnail = thumbnail_data['@attributes']
	32	thumbnails.append({
	33	'url': self._proto_relative_url(thumbnail['url'], 'http:'),
	34	'width': int_or_none(thumbnail.get('width')),
	35	'height': int_or_none(thumbnail.get('height')),
	36	})
	37
	38	subtitles = {}
c7fa5fa4	39	media_subtitle = get_media_node('subTitle')
3793090b	40	if media_subtitle:
	41	if isinstance(media_subtitle, dict):
	42	media_subtitle = [media_subtitle]
	43	for subtitle_data in media_subtitle:
	44	subtitle = subtitle_data['@attributes']
	45	lang = subtitle.get('lang') or 'en'
	46	subtitles[lang] = [{'url': subtitle['href']}]
	47
	48	formats = []
c7fa5fa4	49	media_content = get_media_node('content')
3793090b	50	if isinstance(media_content, dict):
	51	media_content = [media_content]
	52	for media_data in media_content:
	53	media = media_data['@attributes']
	54	media_type = media['type']
	55	if media_type == 'video/f4m':
7e5edcfd	56	formats.extend(self._extract_f4m_formats(
c7fa5fa4	57	media['url'] + '?hdcore=3.4.0&plugin=aasp-3.4.0.132.124',
7e5edcfd	58	video_id, f4m_id='hds', fatal=False))
3793090b	59	elif media_type == 'application/x-mpegURL':
7e5edcfd S	60	formats.extend(self._extract_m3u8_formats(
7e5edcfd S	61	media['url'], video_id, 'mp4', m3u8_id='hls', fatal=False))
3793090b	62	else:
	63	formats.append({
	64	'format_id': media_data['media-category']['@attributes']['label'],
	65	'url': media['url'],
c7fa5fa4	66	'tbr': int_or_none(media.get('bitrate')),
3793090b	67	'filesize': int_or_none(media.get('fileSize')),
	68	})
	69
	70	self._sort_formats(formats)
	71
	72	return {
	73	'id': video_id,
c7fa5fa4	74	'title': get_media_node('title'),
c7fa5fa4	75	'description': get_media_node('description'),
3793090b	76	'thumbnails': thumbnails,
	77	'timestamp': parse_iso8601(item.get('pubDate'), ' '),
	78	'duration': int_or_none(media_content[0].get('@attributes', {}).get('duration')),
	79	'formats': formats,
	80	}