本帖最后由 无敌三脚猫 于 2021-11-23 17:41 编辑 
论坛有个小功能是,在我发帖的时候会提示我,有哪些文件是我之前上传但是没有贴在帖子里的,然后会问我要不要把这种文件删掉或者放进帖子
那么问题来了,我之前上传并且已经放在帖子里的文件怎么办?(这里的“帖子”包括回复贴,所以会很多)怎么找到所有的我上传的文件?(啊这,是不是有点像网盘了)
我这里想要的不是请人用爬虫之类的帮我找我发过的文件,而且想问论坛有没有自带这种功能,我现在其实是不需要的,是在为以后的一个想法做铺垫
我大概能猜到了,正确答案多半是“没有办法”,要是[相册]功能可以开放的话,以后倒是可以把所有图片都放进去(论坛的管理员可能都忘了这个功能了)
啊,那么,有没有版主之类的回答我一句“没有办法”
好了我知道了,没有就是没有,至于“没有办法”这种句子,在版主看来太水了,所以大家也别回复了,我去申请关贴
论坛有个小功能是,在我发帖的时候会提示我,有哪些文件是我之前上传但是没有贴在帖子里的,然后会问我要不要把这种文件删掉或者放进帖子
那么问题来了,我之前上传并且已经放在帖子里的文件怎么办?(这里的“帖子”包括回复贴,所以会很多)怎么找到所有的我上传的文件?(啊这,是不是有点像网盘了)
我这里想要的不是请人用爬虫之类的帮我找我发过的文件,而且想问论坛有没有自带这种功能,我现在其实是不需要的,是在为以后的一个想法做铺垫
我大概能猜到了,正确答案多半是“没有办法”,要是[相册]功能可以开放的话,以后倒是可以把所有图片都放进去(论坛的管理员可能都忘了这个功能了)
啊,那么,有没有版主之类的回答我一句“没有办法”
好了我知道了,没有就是没有,至于“没有办法”这种句子,在版主看来太水了,所以大家也别回复了,我去申请关贴
没有办法
这种就真的没有任何办法
除了你自己一个一个帖子翻之外没有更有效的了
回复的话就别想了,那么多你也翻不过来
现在锁帖是对发帖人开放的
除了你自己一个一个帖子翻之外没有更有效的了
回复的话就别想了,那么多你也翻不过来
现在锁帖是对发帖人开放的
 本帖最后由 绯红的世界 于 2021-11-24 18:33 编辑 
论坛帖子功能是带有保存附件功能的,但是目前我之前发过的另外一个帖子,发布成功了,但还是显示有附件。
我也尝试过用搜索引擎的基本信息检索法来条件查找过自己发的帖子所带文件,很遗憾的是,搜索引擎并没办法查找到
我尝试了一下查朋友的帖子和评论,没办法找到评论,但能查到帖子内容。
这里附上搜索栏输入的:"feishi_jin""大陆" site:www.mcbbs.net
然后我检查了我那位朋友帖子的网页源代码,发现
src="https://attachment.mcbbs.net/data/myattachment/forum/202111/23/011734f88082c05dmhdjsh.png"
我尝试了ping网页代码中的网址和现在的网址来获得服务器ip地址,发现服务器并不是同一个,也就是说你们爬虫也要爬另外一个。这段格式里面我发现了这些图片数据并非储存在mcbbs当前的论坛服务器,也就说论坛连带着回复的功能是储存在另外一个服务器。
他们应该写了一种文件防搜索引擎,另外我也尝试看了一下我另外一个朋友的
src="https://attachment.mcbbs.net/data/myattachment/forum/202111/22/210131e6ubb598npi563ki.png"
他的也是存在名为attachment.mcbbs.net域名的服务器的数据库里面。
图片附件的应该是存在在这里面并且是按日期来分的,这个东西可以正常访问但无法被搜索引擎简单搜索出来,只能使用爬虫了,但是爬虫对于我是开荒级别了,只能给楼主提供一点思路。
突然想起来,再补充一点,如果爬虫可以爬取网页html代码中的数据,可以尝试下条件爬取www.mcbbs.net中条件包含“名字”“文件格式”这样来查可以查到帖子网页数据中的文字,也可以知道自己放了哪些指定名字的文件。
如果不行的话,另外一个多半也不行了,因为另外一个是按照他们的编码来储存的,无法轻易查。
论坛帖子功能是带有保存附件功能的,但是目前我之前发过的另外一个帖子,发布成功了,但还是显示有附件。
我也尝试过用搜索引擎的基本信息检索法来条件查找过自己发的帖子所带文件,很遗憾的是,搜索引擎并没办法查找到
我尝试了一下查朋友的帖子和评论,没办法找到评论,但能查到帖子内容。
这里附上搜索栏输入的:"feishi_jin""大陆" site:www.mcbbs.net
然后我检查了我那位朋友帖子的网页源代码,发现
src="https://attachment.mcbbs.net/data/myattachment/forum/202111/23/011734f88082c05dmhdjsh.png"
我尝试了ping网页代码中的网址和现在的网址来获得服务器ip地址,发现服务器并不是同一个,也就是说你们爬虫也要爬另外一个。这段格式里面我发现了这些图片数据并非储存在mcbbs当前的论坛服务器,也就说论坛连带着回复的功能是储存在另外一个服务器。
他们应该写了一种文件防搜索引擎,另外我也尝试看了一下我另外一个朋友的
src="https://attachment.mcbbs.net/data/myattachment/forum/202111/22/210131e6ubb598npi563ki.png"
他的也是存在名为attachment.mcbbs.net域名的服务器的数据库里面。
图片附件的应该是存在在这里面并且是按日期来分的,这个东西可以正常访问但无法被搜索引擎简单搜索出来,只能使用爬虫了,但是爬虫对于我是开荒级别了,只能给楼主提供一点思路。
突然想起来,再补充一点,如果爬虫可以爬取网页html代码中的数据,可以尝试下条件爬取www.mcbbs.net中条件包含“名字”“文件格式”这样来查可以查到帖子网页数据中的文字,也可以知道自己放了哪些指定名字的文件。
如果不行的话,另外一个多半也不行了,因为另外一个是按照他们的编码来储存的,无法轻易查。