[yt-dlp.git] / yt_dlp / extractor / baidu.py

# coding: utf-8
from __future__ import unicode_literals


from .common import InfoExtractor
from ..utils import unescapeHTML


class BaiduVideoIE(InfoExtractor):
    IE_DESC = '百度视频'
    _VALID_URL = r'https?://v\.baidu\.com/(?P<type>[a-z]+)/(?P<id>\d+)\.htm'
    _TESTS = [{
        'url': 'http://v.baidu.com/comic/1069.htm?frp=bdbrand&q=%E4%B8%AD%E5%8D%8E%E5%B0%8F%E5%BD%93%E5%AE%B6',
        'info_dict': {
            'id': '1069',
            'title': '中华小当家 TV版国语',
            'description': 'md5:51be07afe461cf99fa61231421b5397c',
        },
        'playlist_count': 52,
    }, {
        'url': 'http://v.baidu.com/show/11595.htm?frp=bdbrand',
        'info_dict': {
            'id': '11595',
            'title': 're:^奔跑吧兄弟',
            'description': 'md5:1bf88bad6d850930f542d51547c089b8',
        },
        'playlist_mincount': 12,
    }]

    def _call_api(self, path, category, playlist_id, note):
        return self._download_json('http://app.video.baidu.com/%s/?worktype=adnative%s&id=%s' % (
            path, category, playlist_id), playlist_id, note)

    def _real_extract(self, url):
        category, playlist_id = self._match_valid_url(url).groups()
        if category == 'show':
            category = 'tvshow'
        if category == 'tv':
            category = 'tvplay'

        playlist_detail = self._call_api(
            'xqinfo', category, playlist_id, 'Download playlist JSON metadata')

        playlist_title = playlist_detail['title']
        playlist_description = unescapeHTML(playlist_detail.get('intro'))

        episodes_detail = self._call_api(
            'xqsingle', category, playlist_id, 'Download episodes JSON metadata')

        entries = [self.url_result(
            episode['url'], video_title=episode['title']
        ) for episode in episodes_detail['videos']]

        return self.playlist_result(
            entries, playlist_id, playlist_title, playlist_description)
Commit	Line	Data
21f63302 YCH	1	# coding: utf-8
	2	from __future__ import unicode_literals
	3
21f63302 YCH	4
21f63302 YCH	5	from .common import InfoExtractor
a1d9f6c5	6	from ..utils import unescapeHTML
21f63302 YCH	7
	8
	9	class BaiduVideoIE(InfoExtractor):
446e7645	10	IE_DESC = '百度视频'
5886b38d	11	_VALID_URL = r'https?://v\.baidu\.com/(?P<type>[a-z]+)/(?P<id>\d+)\.htm'
21f63302 YCH	12	_TESTS = [{
	13	'url': 'http://v.baidu.com/comic/1069.htm?frp=bdbrand&q=%E4%B8%AD%E5%8D%8E%E5%B0%8F%E5%BD%93%E5%AE%B6',
	14	'info_dict': {
	15	'id': '1069',
957e0db1	16	'title': '中华小当家 TV版国语',
a1d9f6c5	17	'description': 'md5:51be07afe461cf99fa61231421b5397c',
21f63302 YCH	18	},
	19	'playlist_count': 52,
	20	}, {
	21	'url': 'http://v.baidu.com/show/11595.htm?frp=bdbrand',
	22	'info_dict': {
	23	'id': '11595',
	24	'title': 're:^奔跑吧兄弟',
	25	'description': 'md5:1bf88bad6d850930f542d51547c089b8',
	26	},
957e0db1	27	'playlist_mincount': 12,
21f63302 YCH	28	}]
21f63302 YCH	29
03116772 YCH	30	def _call_api(self, path, category, playlist_id, note):
	31	return self._download_json('http://app.video.baidu.com/%s/?worktype=adnative%s&id=%s' % (
	32	path, category, playlist_id), playlist_id, note)
957e0db1	33
21f63302	34	def _real_extract(self, url):
5ad28e7f	35	category, playlist_id = self._match_valid_url(url).groups()
21f63302	36	if category == 'show':
957e0db1	37	category = 'tvshow'
	38	if category == 'tv':
	39	category = 'tvplay'
21f63302	40
03116772 YCH	41	playlist_detail = self._call_api(
03116772 YCH	42	'xqinfo', category, playlist_id, 'Download playlist JSON metadata')
21f63302	43
957e0db1	44	playlist_title = playlist_detail['title']
a1d9f6c5	45	playlist_description = unescapeHTML(playlist_detail.get('intro'))
21f63302	46
03116772 YCH	47	episodes_detail = self._call_api(
03116772 YCH	48	'xqsingle', category, playlist_id, 'Download episodes JSON metadata')
21f63302	49
b7546397 YCH	50	entries = [self.url_result(
	51	episode['url'], video_title=episode['title']
	52	) for episode in episodes_detail['videos']]
21f63302 YCH	53
	54	return self.playlist_result(
	55	entries, playlist_id, playlist_title, playlist_description)