找回密码
 -注册-
楼主: yanglqq
打印 上一主题 下一主题

RuTracker.org的唱片导出至Excel

[复制链接]
21
发表于 2022-11-30 08:53 | 只看该作者 来自 北京市丰台区
大神级“牛B”
回复

使用道具 举报

22
发表于 2022-11-30 10:46 | 只看该作者 来自 河南省濮阳市
本帖最后由 lyysqlyysq 于 2022-11-30 10:48 编辑

技术大神 造福芸芸众生 感谢!感谢!
回复

使用道具 举报

23
发表于 2022-11-30 10:53 | 只看该作者 来自 广东省深圳市
大神厉害,谢谢!
回复

使用道具 举报

24
 楼主| 发表于 2022-12-1 11:48 | 只看该作者 来自 北京市
本帖最后由 yanglqq 于 2022-12-1 12:03 编辑
leitong 发表于 2022-11-30 04:08
这个不可能做到的 俄网发布的帖子里都没有这个信息

我研究了一下数据,还是有部分帖子里面提供了这个"光盘编号",我将在本月末的数据更新里加上这一列.
回复

使用道具 举报

25
发表于 2022-12-2 14:41 | 只看该作者 来自 广东省佛山市
非常有意义,感谢!!!!
回复

使用道具 举报

26
发表于 2022-12-2 14:45 | 只看该作者 来自 广东省惠州市
厉害
回复

使用道具 举报

27
发表于 2022-12-3 00:29 | 只看该作者 来自 美国
在命令行用php运行下面小程序。给一个网页地址,就可以把网页里所有连续40个0-9和a-f的字符(十六进制磁力码)摘出来。稍微修改可用来自动抓取俄网链接。
<?php
while (true) {
        $url = fgets(STDIN);
        $page = file_get_contents($url);
        preg_match_all('/[0-9a-fA-F]{40}/', $page, $m);
        foreach ($m[0] as $v) echo "magnet:?xt=urn:btih:".$v."\n";
}
?>
回复

使用道具 举报

28
发表于 2022-12-3 10:43 | 只看该作者 来自 上海市杨浦区
楼主功德无量~
回复

使用道具 举报

29
发表于 2022-12-3 15:21 | 只看该作者 来自 广东省湛江市
yanglqq 发表于 2022-12-1 11:48
我研究了一下数据,还是有部分帖子里面提供了这个"光盘编号",我将在本月末的数据更新里加上这一列.

先感谢楼主啦
回复

使用道具 举报

30
发表于 2022-12-3 15:39 | 只看该作者 来自 广东省深圳市
厉害&#128077;
回复

使用道具 举报

31
 楼主| 发表于 2022-12-28 16:35 | 只看该作者 来自 北京市
本帖最后由 yanglqq 于 2022-12-28 16:40 编辑

链接: https://pan.baidu.com/s/1hHtZyzK2064dC8vTmxvv3w?pwd=csau

应坛友dgtool提出的需求:抽取"光盘编号",我把这个"光盘编号"放进了"出版商"列,并用逗号分开.

并非所有发贴人都提供了"光盘编号",这个编号也没有统一编码规则.因此,我只抽取"Номер по каталогу","Лейбл"这两个位置的内容.


















Screenshot from 2022-12-28 16-25-20.png (36.04 KB, 下载次数: 137)

Screenshot from 2022-12-28 16-25-20.png
回复

使用道具 举报

32
发表于 2022-12-28 17:34 | 只看该作者 来自 浙江省台州市
赞, 太强悍了
回复

使用道具 举报

33
发表于 2022-12-30 11:10 | 只看该作者 来自 北京市
厉害!收藏了,多谢多谢!
回复

使用道具 举报

34
发表于 2022-12-30 11:31 来自手机 | 只看该作者 来自 北京市
楼主厉害了
回复

使用道具 举报

35
发表于 2022-12-30 14:24 | 只看该作者 来自 台湾省
nbhh, thanks!
回复

使用道具 举报

36
发表于 2022-12-31 04:55 | 只看该作者 来自 北京市海淀区
yanglqq 发表于 2022-12-28 16:35
链接: https://pan.baidu.com/s/1hHtZyzK2064dC8vTmxvv3w?pwd=csau

应坛友dgtool提出的需求:抽取"光盘 ...

我能提个建议吗
唱片编号是否可以单列一列,不要和唱片发行厂家混在一起,这样excel做筛选时会方便些。

回复

使用道具 举报

37
 楼主| 发表于 2022-12-31 10:17 | 只看该作者 来自 北京市
leitong 发表于 2022-12-31 04:55
我能提个建议吗
唱片编号是否可以单列一列,不要和唱片发行厂家混在一起,这样excel做筛选时会方便些。
...

如果这样更方便,那么当然可以分开单独搞一列.

有其他需求的坛友都可以在这个贴子里讨论和提意见,改进后的功能会在下一次数据更新中出现.


回复

使用道具 举报

38
发表于 2022-12-31 11:19 来自手机 | 只看该作者 来自 北京市
yanglqq 发表于 2022-12-31 10:17
如果这样更方便,那么当然可以分开单独搞一列.

有其他需求的坛友都可以在这个贴子里讨论和提意见,改 ...

太感谢了。最好能把地平线搞的那些要素都列上。比如曲风,抓取形式等等,只要能抓到的明确的要素就单列一列。
回复

使用道具 举报

39
发表于 2022-12-31 17:54 | 只看该作者 来自 江苏省常州市
大神厉害,谢谢!
回复

使用道具 举报

40
发表于 2023-1-1 11:05 | 只看该作者 来自 广东省广州市
谢谢分享,祝新年快乐!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | -注册-

本版积分规则

Archiver|手机版|粤icp备09046054号|耳机网-耳机大家坛

粤公网安备 44030602000598号 耳机大家坛、www.erji.net、网站LOGO图形均为注册商标

GMT+8, 2024-5-14 10:54

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表