[yt-dlp.git] / youtube_dl / extractor / sixplay.py

# coding: utf-8
from __future__ import unicode_literals

import re

from .common import InfoExtractor
from ..compat import (
    compat_parse_qs,
    compat_str,
    compat_urllib_parse_urlparse,
)
from ..utils import (
    determine_ext,
    int_or_none,
    try_get,
    qualities,
)


class SixPlayIE(InfoExtractor):
    IE_NAME = '6play'
    _VALID_URL = r'(?:6play:|https?://(?:www\.)?6play\.fr/.+?-c_)(?P<id>[0-9]+)'
    _TEST = {
        'url': 'http://www.6play.fr/le-meilleur-patissier-p_1807/le-meilleur-patissier-special-fetes-mercredi-a-21-00-sur-m6-c_11638450',
        'md5': '42310bffe4ba3982db112b9cd3467328',
        'info_dict': {
            'id': '11638450',
            'ext': 'mp4',
            'title': 'Le Meilleur Pâtissier, spécial fêtes mercredi à 21:00 sur M6',
            'description': 'md5:308853f6a5f9e2d55a30fc0654de415f',
            'duration': 39,
            'series': 'Le meilleur pâtissier',
        },
        'params': {
            'skip_download': True,
        },
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)

        data = self._download_json(
            'https://pc.middleware.6play.fr/6play/v2/platforms/m6group_web/services/6play/videos/clip_%s' % video_id,
            video_id, query={
                'csa': 5,
                'with': 'clips',
            })

        clip_data = data['clips'][0]
        title = clip_data['title']

        urls = []
        quality_key = qualities(['lq', 'sd', 'hq', 'hd'])
        formats = []
        for asset in clip_data['assets']:
            asset_url = asset.get('full_physical_path')
            protocol = asset.get('protocol')
            if not asset_url or protocol == 'primetime' or asset_url in urls:
                continue
            urls.append(asset_url)
            container = asset.get('video_container')
            ext = determine_ext(asset_url)
            if container == 'm3u8' or ext == 'm3u8':
                if protocol == 'usp' and not compat_parse_qs(compat_urllib_parse_urlparse(asset_url).query).get('token', [None])[0]:
                    asset_url = re.sub(r'/([^/]+)\.ism/[^/]*\.m3u8', r'/\1.ism/\1.m3u8', asset_url)
                    formats.extend(self._extract_m3u8_formats(
                        asset_url, video_id, 'mp4', 'm3u8_native',
                        m3u8_id='hls', fatal=False))
                    formats.extend(self._extract_f4m_formats(
                        asset_url.replace('.m3u8', '.f4m'),
                        video_id, f4m_id='hds', fatal=False))
                    formats.extend(self._extract_mpd_formats(
                        asset_url.replace('.m3u8', '.mpd'),
                        video_id, mpd_id='dash', fatal=False))
                    formats.extend(self._extract_ism_formats(
                        re.sub(r'/[^/]+\.m3u8', '/Manifest', asset_url),
                        video_id, ism_id='mss', fatal=False))
                else:
                    formats.extend(self._extract_m3u8_formats(
                        asset_url, video_id, 'mp4', 'm3u8_native',
                        m3u8_id='hls', fatal=False))
            elif container == 'mp4' or ext == 'mp4':
                quality = asset.get('video_quality')
                formats.append({
                    'url': asset_url,
                    'format_id': quality,
                    'quality': quality_key(quality),
                    'ext': ext,
                })
        self._sort_formats(formats)

        def get(getter):
            for src in (data, clip_data):
                v = try_get(src, getter, compat_str)
                if v:
                    return v

        return {
            'id': video_id,
            'title': title,
            'description': get(lambda x: x['description']),
            'duration': int_or_none(clip_data.get('duration')),
            'series': get(lambda x: x['program']['title']),
            'formats': formats,
        }
Commit	Line	Data
93ad6c6b RA	1	# coding: utf-8
	2	from __future__ import unicode_literals
	3
c8b8fb0a RA	4	import re
c8b8fb0a RA	5
93ad6c6b	6	from .common import InfoExtractor
4bf18702 RA	7	from ..compat import (
	8	compat_parse_qs,
	9	compat_str,
	10	compat_urllib_parse_urlparse,
	11	)
93ad6c6b	12	from ..utils import (
ab49d7a9	13	determine_ext,
b9c9cb5f S	14	int_or_none,
	15	try_get,
	16	qualities,
93ad6c6b RA	17	)
	18
	19
	20	class SixPlayIE(InfoExtractor):
c8b8fb0a	21	IE_NAME = '6play'
93ad6c6b RA	22	_VALID_URL = r'(?:6play:\|https?://(?:www\.)?6play\.fr/.+?-c_)(?P<id>[0-9]+)'
93ad6c6b RA	23	_TEST = {
b9c9cb5f	24	'url': 'http://www.6play.fr/le-meilleur-patissier-p_1807/le-meilleur-patissier-special-fetes-mercredi-a-21-00-sur-m6-c_11638450',
93ad6c6b RA	25	'md5': '42310bffe4ba3982db112b9cd3467328',
93ad6c6b RA	26	'info_dict': {
b9c9cb5f	27	'id': '11638450',
93ad6c6b	28	'ext': 'mp4',
b9c9cb5f S	29	'title': 'Le Meilleur Pâtissier, spécial fêtes mercredi à 21:00 sur M6',
	30	'description': 'md5:308853f6a5f9e2d55a30fc0654de415f',
	31	'duration': 39,
	32	'series': 'Le meilleur pâtissier',
	33	},
	34	'params': {
	35	'skip_download': True,
93ad6c6b RA	36	},
	37	}
	38
	39	def _real_extract(self, url):
	40	video_id = self._match_id(url)
b9c9cb5f S	41
	42	data = self._download_json(
	43	'https://pc.middleware.6play.fr/6play/v2/platforms/m6group_web/services/6play/videos/clip_%s' % video_id,
	44	video_id, query={
	45	'csa': 5,
	46	'with': 'clips',
	47	})
	48
	49	clip_data = data['clips'][0]
	50	title = clip_data['title']
93ad6c6b	51
c8b8fb0a	52	urls = []
0c2ac64b	53	quality_key = qualities(['lq', 'sd', 'hq', 'hd'])
93ad6c6b	54	formats = []
b9c9cb5f S	55	for asset in clip_data['assets']:
b9c9cb5f S	56	asset_url = asset.get('full_physical_path')
c8b8fb0a RA	57	protocol = asset.get('protocol')
c8b8fb0a RA	58	if not asset_url or protocol == 'primetime' or asset_url in urls:
93ad6c6b	59	continue
c8b8fb0a	60	urls.append(asset_url)
b9c9cb5f S	61	container = asset.get('video_container')
	62	ext = determine_ext(asset_url)
	63	if container == 'm3u8' or ext == 'm3u8':
4bf18702	64	if protocol == 'usp' and not compat_parse_qs(compat_urllib_parse_urlparse(asset_url).query).get('token', [None])[0]:
c8b8fb0a RA	65	asset_url = re.sub(r'/([^/]+)\.ism/[^/]*\.m3u8', r'/\1.ism/\1.m3u8', asset_url)
	66	formats.extend(self._extract_m3u8_formats(
	67	asset_url, video_id, 'mp4', 'm3u8_native',
	68	m3u8_id='hls', fatal=False))
	69	formats.extend(self._extract_f4m_formats(
	70	asset_url.replace('.m3u8', '.f4m'),
	71	video_id, f4m_id='hds', fatal=False))
	72	formats.extend(self._extract_mpd_formats(
	73	asset_url.replace('.m3u8', '.mpd'),
	74	video_id, mpd_id='dash', fatal=False))
	75	formats.extend(self._extract_ism_formats(
5abcca90	76	re.sub(r'/[^/]+\.m3u8', '/Manifest', asset_url),
c8b8fb0a RA	77	video_id, ism_id='mss', fatal=False))
	78	else:
	79	formats.extend(self._extract_m3u8_formats(
	80	asset_url, video_id, 'mp4', 'm3u8_native',
	81	m3u8_id='hls', fatal=False))
b9c9cb5f S	82	elif container == 'mp4' or ext == 'mp4':
b9c9cb5f S	83	quality = asset.get('video_quality')
93ad6c6b	84	formats.append({
b9c9cb5f	85	'url': asset_url,
93ad6c6b	86	'format_id': quality,
0c2ac64b	87	'quality': quality_key(quality),
ab49d7a9	88	'ext': ext,
93ad6c6b RA	89	})
	90	self._sort_formats(formats)
	91
b9c9cb5f S	92	def get(getter):
	93	for src in (data, clip_data):
	94	v = try_get(src, getter, compat_str)
	95	if v:
	96	return v
	97
93ad6c6b RA	98	return {
93ad6c6b RA	99	'id': video_id,
b9c9cb5f S	100	'title': title,
	101	'description': get(lambda x: x['description']),
	102	'duration': int_or_none(clip_data.get('duration')),
	103	'series': get(lambda x: x['program']['title']),
93ad6c6b RA	104	'formats': formats,
93ad6c6b RA	105	}