扫码分享
论文降重其实是一件很简朴的事,摸清套路后完全不需要花费太多精神。可是知乎上现在似乎没有技术帖讲清楚,所以我分享一下详细履历。由于知网价钱很高,终稿之前一般都是用其他查重网站查重。这里给出一个评测文章,先容了十个查重网站,很有参考价值。
我凭据这个帖子体验了几个查重网站,最终发现确实是papertime和paperfree最为价廉物美。这两个网站貌似是同一家公司的,都送新用户10000+字,所以我们可以用包罗但不限于怙恃、叔叔阿姨、爷爷奶奶等全家人的手机号注册新用户,然后就再也不用花钱了。
凭据给出的重复工具泉源可以看出这个网站的算法和重复率比力靠谱。组成鲜明对比的是格子达,给出的重复文献泉源可以与我写的句子八杆子搭不到边。
最后凭据履历,如果在paperfree/time能降到10以下,在知网应该就稳了。我小我私家从初稿的20%降到现在的3.76%。(更新:同份文本在学校知网检测的效果为1.2%,可能是因为知网的单句检测算法不如papertime严格。
其实另有下降空间,只不外没须要再改了…)值得一提的是,这两个网站都可以在线改重。对比红/黄句和重复文献泉源以及句子相似度,可以针对性地修改,边改边查效率很是高。手把手降重攻略一、首先摸清楚查重的算法。
Papertime的算法是:总体相似度 = 相似字数 / 检测字数被系统自动识别出来的非正文部门(如目录,标题,公式,图表,参考文献等)不到场检测,检测字数一般略小于论文字数。相似字数 =(句子1字数 * 句子1相似度 + 句子2字数 * 句子2相似度 + ...... + 句子n字数 * 句子n相似度),句子相似度规模0.00~1.00,绿色句子相似度根据0盘算。红色句子为重度相似(80%~100%),建议修改;橙色句子为轻度相似(50%~80%),可酌情修改;绿色句子表现没有检测到相似语句。
简朴归纳:(其中i句相似度>50%为有效,<50%记作0)简朴明白:查重时把文章剖析为一个个小句,凭据某个算法算出单句相似度。把其中相似度大于50%的句子的相似字数加总再除以论文总字数即为重复率。单句相似度这个观点似乎比力玄学,网站没有明确说明算法,可是我们也可以简朴明白一下,或许就是“我写的某个句子和已有文献句子的相同字数占该句子总字数的百分比”之类的工具。最重要的一个信息是:相似度>50%的句子才会被标黄,相似度>80%的句子会被标红。
相似度<50%的被标绿而且相似度被计为0.二、那我们的降重目的就很清晰了,一共有两个途径:①降低每句相似字数,以降低总相似字数;②把句子的相似度降低到50%以下,那么这句相似字数直接就变为0了。我们发现这两个途径其实一样。
可是②的效果更显著,因为能直接把句子变绿(要坚强)从而大幅降重,所以对于大多数句子,我们的目的显然是用方法②把他变绿。固然另有一些句子很是坚强,好比“凭据图2-1我们可以看到,...”这种句子就比力难绿,可是总体而言难绿的句子不多,所以把重复率降到5%以下是不难的。三、详细措施我们现在看到的大多数降重思想都局限在方法①,即没有目的地用同义词替换、把字句被字句转换等方法努力降低相似字数。
可是有了科学思想的指导,我们的修改偏向就更清晰了。1.首要争取工具——50出头像这种相似度50%出头的黄色句子是首要争取工具,因为只要改几个字就能变绿,从50直接酿成0,因而在降重工程中最受接待(大家都争着绿他,很是可怜)。改成“这进一步说明晰IIT现象更易发生于初始要素禀赋相近的国家间”后,绿化乐成。
2.短句合并发展句增加分母这种界说引用类的红色句子,相似度88%,应该无可救药了吧?可是查重剖析句子是会凭据标点的,我删去句子后面的逗号,将短句连发展句以增加该句的分母,对语序做了调整,最终竟然硬生生把这句界说给绿化乐成了(请叫我绿化小达人)。修改后的句子:“SITC分类划定的相同组别中具有一定生产或消费替代水平的产物的双向流动”,绿化乐成√。
我也不知道这样一改相似度怎么就降到50%以下了,可是这种思路可以借鉴,就是短句并长句增加分母。同理也可以通过扩句增加分母,其精髓在于用自己的语言稀释干货(注水绿化法),以降低相似度。
如“A导致了B”改成“C带来的A导致了D现象的发生最终造成B的效果”,其中C和D可以扯得越长越好,这样句子相似度会大大降低。3.长句剖析为短句弃卒保帅总有些专业词组险些不行能修改,而且在句子中占的比重过大,需要战略性地放弃修改这些部门,把他们独立成一个短句分散出去以利便后面句子的绿化工程。
例如:Nuno 和Faustino(2009)运用面板数据模型对葡萄牙和金砖国家商业中的工业内商业水平影响因素举行的实证分析讲明,一国资源禀赋的数量与该国工业内商业生长水平存在负相关性。这个长句子开头部门的“Nuno 和Faustino(2009)...”一堆字符是无法改变的(名字换成中文也同样被人写过了),很是占空间,即便把后面的内容加长许多也很难把整个句子的相似度降到50%以下。
这个时候可以放弃小部门的降重,把前半句改成独立的句子“Nuno 和Faustino(2009)同样对IIT影响因素举行了研究。”后面也改写成独立的句子“他们应用面板数据模型举行的实证研究发现,在葡萄牙与金砖国家的双边商业中,初始的自然资源对该国对外商业的IIT指数具有负面的影响效应”。这样虽然前面的句子依然重复,可是舍弃了大段无法改变的重复字符后,后面的句子就有了被绿化的可能,整体的重复率还是会降低。
4.无可救药型直接删去下面这个红色的句子预计被无数人用过了,大家也很可能已经实验过用种种姿势♂绿他,于是知难而退,索性直接删掉,也不影响文章的意思。四、履历总结总之在线改重功效很是好用,可是仍存在该网站和知网查重率纷歧致的问题,在一些情况下查重率偏差很大。
重复率有差异的原因主要在两处:一是算法严格水平差异;二是网站背后的数据库巨细差异。知网本科论文查重与其他网站的最大区别在于知网pmlc有【大学生论文团结对比库】,这个数据库收录了各学校历年的结业论文。如果大量引用被知网数据库收录而未被其他网站收录的语段,那么在其他网站检测出的重复率就会显著低于知网重复率。
可是如果主要内容都是自己认真写的,那么知网查重效果和其他网站效果不会有太大差异。事实上由于其他网站为了弥补数据库较小的问题,通常会接纳越发严格的算法使重复率往靠近知网的偏向修正,因此认真写的论文在知网的重复率很可能比其他网站更低。(案例A:某同学前几天私信我说paperpass重复率39%,可是他说自己真的是认真写的。
我就建议他在学校知网上试一次,效果出来竟然是6.9%(固然在用知网查之前他自己也修悔改一些)!这说明在某些情况下paperpass的算法过于严格)相信大多数同学还是坚持原创,那么用paper系列肯定能满足需求了,降到5~10%不是什么难事。对于大量借鉴的同学来说,在paper系列网站在线改重也是有资助的。
上面的降重技巧也同样可借鉴。
本文来源:天博综合体育官方app下载-www.86swim.com
品牌战略营销咨询
黑龙江省鹤岗市兴平市标远大楼83号
Copyright © 2002-2022 www.86swim.com. 天博综合体育官方app下载科技 版权所有
天博综合体育官方app下载·ios/安卓版/手机APP下载
网站备案号:ICP备20624051号-4