如何讓一些虛假的論文通過(guò)一些手段,狠刷h指數(shù),讓作者誤判文章的質(zhì)量?最近,格勒諾布爾大學(xué)的CYRIL LABBE教授為了證明學(xué)術(shù)搜索引擎在收錄廣泛的優(yōu)勢(shì)下,卻隱藏著巨大隱患,那就是被引數(shù)造假。
該教授利用MIT研究人員發(fā)明的SCIgen科技論文自動(dòng)生成器,發(fā)表了102篇署名為“IKE ANTKARE”的學(xué)術(shù)論文,讓IKE ANTKARE在谷歌學(xué)術(shù)中的h指數(shù)一下飆升到了94,成為計(jì)算機(jī)科學(xué)領(lǐng)域科學(xué)家H指數(shù)排名第6的學(xué)者。
作者可能除了對(duì)刷爆h指數(shù)這事表示關(guān)心外,也許還會(huì)問(wèn)SCIgen是什么東東?在此小編簡(jiǎn)單介紹一下SCIgen:
SCIgen有多種叫法,如隨機(jī)文本生成器、論文生成器等,總之就是一種會(huì)敲鍵盤(pán)就能分分鐘搞定一篇科技論文的造假軟件,它是由MIT學(xué)生于2005年開(kāi)發(fā)的,初衷是為了證明用軟件生成科學(xué)論文是輕而易舉的事,他們把這個(gè)軟件放到互聯(lián)網(wǎng)上,提供免費(fèi)下載。但是,潘多拉魔盒也就此打開(kāi),許多人用它偽造論文,僅5年間,被出版社查實(shí)的有超百篇論文系該軟件生成。
那么CYRIL LABBE教授是如何刷谷歌學(xué)術(shù)中的 h 指數(shù)值?
首先,要讓這些假論文被谷歌學(xué)術(shù)收錄,事實(shí)上,學(xué)術(shù)搜索引擎和我們平常用的搜索引擎在算法上有非常大的不同,CYRIL LABBE教授為了讓谷歌學(xué)術(shù)收錄這些論文,他讓每篇論文都對(duì)所有的100篇論文進(jìn)行引用,然后生成該論文的html頁(yè)面,html頁(yè)面包含論文標(biāo)題、摘要及PDF全文鏈接等信息。還在這100篇偽造論文的參考文獻(xiàn)中加入了1篇真實(shí)的已被谷歌學(xué)術(shù)索引的論文,然后將這100篇論文上傳到網(wǎng)上。不久,IKE ANTKARE的h指數(shù)就已經(jīng)飆升到了94,甚至高于愛(ài)因斯坦的h指數(shù)84。
我們?cè)诖舜螌?shí)驗(yàn)性的造假事件中,至少可以看到,在收錄范圍廣泛的學(xué)術(shù)搜索引擎所呈現(xiàn)出的高被引數(shù)很容易被人為造假,以這些學(xué)術(shù)搜索引擎的被引次數(shù)為依據(jù),作為自己論文影響力的佐證是不靠譜的。