第四百七十二章 跑步进场(1 / 2)

“汇聚全世界的资源,分享你我他的快乐……”

听着郑秋缓缓读出这条产品介绍,俞华忍不住砸吧砸吧嘴。

“嗯!听着的确像是某种资源分享平台?”

郑秋登时无语,翻着白眼指了指下面的一行小字。

“这么牛逼的公司怎么可能这么肤浅!看下面!

精选优质知识资源、促进教育方法改革、提升人才质量、推动智慧分享。

弘扬中华文化,吸收世界文明。

加快脚步迈入知识型社会——广大莘莘学子的福音!

这格局……一听就大的没边了!”

“某个相亲网站还喊口号说自己想促进人类繁衍,延续地球文明呢,大的没边谁不会啊?”

“嗯……相亲网站?”

郑秋狐疑的盯着面前的大龄光棍。

“咳!这都是小细节,那什么,我们快点进去看看有没有什么惊喜吧,这可是白夜纪出品!

唔……上面写着可以用天枢ERP或者八戒的账号进行同步完成注册,咱们都没有。

如果是新用户,那么个人账号注册则需要实名认证,等会儿……”

于是,注册……输入身份证号……绑定手机号……

一番操作之后,俞华获得了一个初始账号。

登陆之后,眼前立刻切换到了一个看着十分简洁的新界面。

左边是个信息栏,除了自己的个人姓名和待编辑资料外,还有一个叫做“智慧币”的东西,目前数额为5。

右边则是光秃秃的什么都没有,就一个孤零零的搜索框,背景则是白夜纪的机器人logo。

“这东西怎么用?”

“既然是知识类的分享平台,那应该是类似搜索引擎的东西,先输入一个搜索项目试试看。”

于是俞华随手输入“人工神经网络(ANN)随机森林算法相关期刊论文”……

这也正是他目前的研究课题。

“刷!”只见界面一变。

10篇相关论文及其简介就一项项出现在两人面前。

“咦?还不错诶,上面头几篇都是这个领域引用次数较多,权重较高的权威论文……

看!第10篇还是你去年的论文!”俞华惊喜道。

郑秋抢过鼠标,点开自己那篇论文,果然,是自己写的没错,上面清楚的标注了著作人和发表时间。

看着自己的作品,郑秋有些臭屁的点点头。

“嗯!看来这个检索还是有些眼光的嘛!”

俞华懒得搭理这个自恋狂,又点击下一页,继续查看检索顺序10~20的其他论文,果然又发现了好几篇熟悉的业内权威。

一直到第100篇,几乎没有一篇是无效的“水文”。

就这检索效率和效果,就绝不比蜘网来的差了。

而且令人惊讶的是,别的网站通过期刊论文检索出来的,只要年份稍微久远点,一般都是图文版,也就是用相机扫描下来的。

因为以前电脑普及度不高,论文大多还只是进行纸质存档的。

就算后来电脑普及了,一篇篇重新机打出来也是一项异常庞大浩瀚的工程,所以只能扫描电子化进行存档。

只不过,那清晰度就像是在对着电脑看旧报纸,很影响阅读体验。

比如有一篇《随机向量学习模型》,他明明记得,在蜘网的检索数据库中它还是一篇扫描文档。

然而这里显示出来的,却是清晰完整的电子档。

就连文章中的表格和图文,也进行了高度还原原著的电子化重制,让人一目了然。

就算是原作者看了,怕是也只能说一句“无懈可击”……

“这帮家伙,该不是把旧的数据库文献全都给优化了一遍吧……”

郑秋脑子里突然蹦出一个极为不可思议的想法。

这种工程量,绝非少量人力可以完成,唯一的可能就是依靠自动化程序进行批量图文转换识别……

如果真是如此,那这图文转换效果简直炸裂啊!

“这东西说是还能查重来着,不知道效果怎么样……我试试看。”

俞华没忘记自己原本的目的,当即从电脑里找出一篇已经审核过的硕士生论文,按照提示直接拖入对话框……

【请问是否花费1智慧币进行查重服务?是/否】

“原来要花站内币啊……1币一次,这样看来每个新用户都有5次免费查重机会?还不错。”

俞华心里还是有些满意的。

虽说不是完全免费,总比那些个上来就直接弹付款码的要好些。

选择“是”,下一刻,画面上蹦出一个进度条。

大概3分钟的功夫,进度条就缓缓拉到底,最终跳出来一个大号数字——重复率69.3%!

“啥?69.3%?”俞华脸上有些错愕。

“怎么啦?”

“这篇论文我用蜘网查重过,最后结果是36.2%来着……喏,这是蜘网的查重报告单。”

俞华从旁边的书桌上找了找,递过去一张打印A4纸。

当蜘网查重系统在检测论文内容时,会将论文与自己的系统库进行比对。

如果发现连续出现13个字符,也就是七八个汉字类似,就会判为重复,计算这部分重复率,最后将查重后的数据显示在最后的报告单中。

同时还会在文本中以红色字体显示重复内容,并在重复区域旁标注出该段引用的相关文献。

总的来说,蜘网虽然收费贵,但是就检索结果来说,服务还是比较到位的。

郑秋看着手中的查重报告单,又看了看电脑上给出的69.3%的高重复率,皱了皱眉。

“别的不说,就这查重速度,就快的有些匪夷所思了,该不是互联网算命……玩随机那一套乱给的吧?”

刚刚那进度条,满打满算也不超过3分钟。

3分钟,看似有些漫长,但相对规模庞大的文献数据库检索量来说,简直快到不可思议!

要知道,蜘网的单次查重耗时一般为30~60分钟,在毕业高峰期间甚至会超过2个小时。

相比之下,这样的“查重”耗时,多少显得有些儿戏了。

什么样的运算速度和检索算法,能在这么短的时间内检索完那么庞大的文献库?

“不可能吧……这么优秀的公司,而且人家也给了查重结果的。”

俞华说着点开下方的“查重报告”按钮。

下一刻,电脑前的两人都愣住了。

画面上,这篇论文超过一半的地方都被红色标注了出来,旁边挂了引用文献和对应跳转链接。

密密麻麻的根本不像是胡编乱造……

“真的假的啊?”郑秋有些傻眼。

他一把拿起那份蜘网的查重报告,开始逐行比对。

“这个有,这个也有……嘶~全中!”

蜘网检索出来的重复段落标注和引用文献,这里全都有,而且还贴心的给了文献链接,真假一目了然。

那么多出来的这些……

通过两人比对,得出了一个令人震惊的结论。

那就是这个智慧树所检索的数据库……居然比蜘网来的还要全面!

通常来说,论文查重系统的数据库,主要包括“学术期刊数据库”、“学位论文数据库”以及“互联网数据库”。

这其中“互联网数据库”最为复杂,指的是大量的网页、博客、论坛等互联网信息资源。

论文查重系统会将互联网数据库作为重要的对照,检测论文中是否存在互联网上已被公开发布的相似内容。

“卧槽!对方哪儿来的这么庞大的数据库资源?”俞华不解道。

下一刻他似乎是反应过来……

“该不会,是爬虫程序吧?”

国外有个牛逼的程序猿,靠着编写的强大爬虫程序,抓取了世界上超过6亿个网站的网络公共资源!

最后就连骨歌、亚马孙、Adobe、ebay等互联网大厂,都前来寻求数据支持。

一桌一椅一电脑。

单枪匹马搞出了年营收1400万美元的夸张战绩!

而整个公司仅有一个员工,堪称有史以来商业效率最高的企业!

所以……会爬数据,也是绝对的高科技!

“不止!你看,就连图表或者公式的抄袭……对方也能检测出来!”

郑秋指着一串字符旁的标注震惊道。

蜘网的检测技术是有缺陷的,部分“图表”,“mathtype编辑公式”,“word代码”都不能识别,这就留下了一些漏洞。

而现在……这个漏洞被堵上了……

这已经不是牛逼了,而是牛逼Plus啊!