[yt-dlp.git] / youtube_dl / extractor / hotnewhiphop.py

from __future__ import unicode_literals

import base64

from .common import InfoExtractor
from ..compat import (
    compat_urllib_parse,
    compat_urllib_request,
)
from ..utils import (
    ExtractorError,
    HEADRequest,
)


class HotNewHipHopIE(InfoExtractor):
    _VALID_URL = r'http://www\.hotnewhiphop\.com/.*\.(?P<id>.*)\.html'
    _TEST = {
        'url': 'http://www.hotnewhiphop.com/freddie-gibbs-lay-it-down-song.1435540.html',
        'md5': '2c2cd2f76ef11a9b3b581e8b232f3d96',
        'info_dict': {
            'id': '1435540',
            'ext': 'mp3',
            'title': 'Freddie Gibbs - Lay It Down'
        }
    }

    def _real_extract(self, url):
        video_id = self._match_id(url)
        webpage = self._download_webpage(url, video_id)

        video_url_base64 = self._search_regex(
            r'data-path="(.*?)"', webpage, 'video URL', default=None)

        if video_url_base64 is None:
            video_url = self._search_regex(
                r'"contentUrl" content="(.*?)"', webpage, 'content URL')
            return self.url_result(video_url, ie='Youtube')

        reqdata = compat_urllib_parse.urlencode([
            ('mediaType', 's'),
            ('mediaId', video_id),
        ])
        r = compat_urllib_request.Request(
            'http://www.hotnewhiphop.com/ajax/media/getActions/', data=reqdata)
        r.add_header('Content-Type', 'application/x-www-form-urlencoded')
        mkd = self._download_json(
            r, video_id, note='Requesting media key',
            errnote='Could not download media key')
        if 'mediaKey' not in mkd:
            raise ExtractorError('Did not get a media key')

        redirect_url = base64.b64decode(video_url_base64).decode('utf-8')
        redirect_req = HEADRequest(redirect_url)
        req = self._request_webpage(
            redirect_req, video_id,
            note='Resolving final URL', errnote='Could not resolve final URL')
        video_url = req.geturl()
        if video_url.endswith('.html'):
            raise ExtractorError('Redirect failed')

        video_title = self._og_search_title(webpage).strip()

        return {
            'id': video_id,
            'url': video_url,
            'title': video_title,
            'thumbnail': self._og_search_thumbnail(webpage),
        }
Commit	Line	Data
99f770ca PH	1	from __future__ import unicode_literals
99f770ca PH	2
5b66de88 JMS	3	import base64
	4
	5	from .common import InfoExtractor
5c40bba8	6	from ..compat import (
99f770ca PH	7	compat_urllib_parse,
99f770ca PH	8	compat_urllib_request,
5c40bba8 PH	9	)
5c40bba8 PH	10	from ..utils import (
99f770ca PH	11	ExtractorError,
	12	HEADRequest,
	13	)
5b66de88 JMS	14
	15
	16	class HotNewHipHopIE(InfoExtractor):
59188de1	17	_VALID_URL = r'http://www\.hotnewhiphop\.com/.\.(?P<id>.)\.html'
6f5ac90c	18	_TEST = {
99f770ca	19	'url': 'http://www.hotnewhiphop.com/freddie-gibbs-lay-it-down-song.1435540.html',
99f770ca PH	20	'md5': '2c2cd2f76ef11a9b3b581e8b232f3d96',
99f770ca PH	21	'info_dict': {
5c40bba8 PH	22	'id': '1435540',
5c40bba8 PH	23	'ext': 'mp3',
99f770ca	24	'title': 'Freddie Gibbs - Lay It Down'
6f5ac90c PH	25	}
6f5ac90c PH	26	}
5b66de88 JMS	27
5b66de88 JMS	28	def _real_extract(self, url):
5c40bba8 PH	29	video_id = self._match_id(url)
5c40bba8 PH	30	webpage = self._download_webpage(url, video_id)
5b66de88	31
99f770ca	32	video_url_base64 = self._search_regex(
5c40bba8	33	r'data-path="(.*?)"', webpage, 'video URL', default=None)
ed54491c	34
99f770ca PH	35	if video_url_base64 is None:
99f770ca PH	36	video_url = self._search_regex(
5c40bba8	37	r'"contentUrl" content="(.*?)"', webpage, 'content URL')
ed54491c	38	return self.url_result(video_url, ie='Youtube')
5b66de88	39
99f770ca PH	40	reqdata = compat_urllib_parse.urlencode([
	41	('mediaType', 's'),
	42	('mediaId', video_id),
	43	])
	44	r = compat_urllib_request.Request(
	45	'http://www.hotnewhiphop.com/ajax/media/getActions/', data=reqdata)
	46	r.add_header('Content-Type', 'application/x-www-form-urlencoded')
	47	mkd = self._download_json(
	48	r, video_id, note='Requesting media key',
	49	errnote='Could not download media key')
	50	if 'mediaKey' not in mkd:
	51	raise ExtractorError('Did not get a media key')
	52
	53	redirect_url = base64.b64decode(video_url_base64).decode('utf-8')
	54	redirect_req = HEADRequest(redirect_url)
	55	req = self._request_webpage(
	56	redirect_req, video_id,
	57	note='Resolving final URL', errnote='Could not resolve final URL')
	58	video_url = req.geturl()
	59	if video_url.endswith('.html'):
	60	raise ExtractorError('Redirect failed')
5b66de88	61
5c40bba8	62	video_title = self._og_search_title(webpage).strip()
5b66de88	63
99f770ca PH	64	return {
	65	'id': video_id,
	66	'url': video_url,
	67	'title': video_title,
5c40bba8	68	'thumbnail': self._og_search_thumbnail(webpage),
99f770ca	69	}