有人知道他们是怎么做到的吗?我目前使用OffLiberty.com解析Mixcloud链接以获取用于iOS兼容性的自定义
HTML5播放器的原始MP3 URL,我只是想知道是否有人知道他们的过程是如何工作的,所以我可以创建类似于“切割”的东西中间人’可以说,所以我的最终用户不必去外部网站获取他们想要发布的混音的MP3链接.只是一个想法真的,如果不能做到,那不是非常重要,但这将是一个很好的接触:)
有人有什么想法吗?
最佳答案 请注意,我反对内容抓取,你应该要求这些网站废弃他们的MP3网址.另外,如果我是他们的话,我现在就阻止你,然后加入维特纳姆.
无论如何,您可以使用DOMDocument
解析其HTML.
例如 :
<?php
// just so you don't see parse errors
$internal_errors = libxml_use_internal_errors(true);
// initialize the document
$doc = new DomDocument();
// load a page
$doc->loadHTMLFile('http://www.mixcloud.com/LaidBackRadio/le-motel-on-the-road/');
// initialize XPATH for the document
$xpath = new DomXPath($doc);
// span with "data-preview-url" seems to contain MP3 url
// we request them inside a DomNodeList http://www.php.net/manual/en/class.domnodelist.php
$mp3 = $xpath->query('//span[@data-preview-url]');
foreach($mp3 as $m){
// we print the attribute value
echo $m->attributes->getNamedItem('data-preview-url')->nodeValue . '<br/>';
}
libxml_use_internal_errors($internal_errors);