首頁>社情·民意>你言我語 你言我語
網絡作品“偽原創”花樣多:工具可自動生成文章
在線自動生成“偽原創”
記者在調查中發現,除了劉思含提到的各種“偽原創”手法,還有一種模式——在線自動生成“偽原創”。
記者通過閱讀多個“偽原創”工具的說明并試用,梳理出其制作過程和原理。“偽原創”的目標是通過同義詞替換的方式,讓搜索引擎認為是一篇原創文章,從而提高在搜索結果中的排名。“偽原創”工具或在線生成網站都有自己的同義詞庫,有的通過免費模式向用戶開放一部分,另一部分更大的同義詞庫則要用戶付費后才可以使用。
“用‘偽原創’工具可以把在互聯網上復制的文章瞬間變成您自己的原創文章?!币粋€“偽原創”網站的說明這樣寫到。此類“偽原創”工具還可以在文章中隨意植入想被讀者看到的關鍵詞或網址,以達到宣傳作用。
記者把原創文章復制粘貼到這樣的網站上,一鍵即可生成同義詞替換過的文章,被替換的詞通常用不同的字體和顏色標記出來。
在這個過程中,記者發現,專業類文章替換較少;生活類的文章替換掉的詞較多;文章越長,替換率越高。在線“偽原創”工具還附帶相似度檢測、關鍵詞排序、關鍵詞統計、關鍵詞組合工具等在線工具,文章整體替換的比例在10%左右。替換后的文章可讀性降低,網站建議對文章進行人工修改提升可讀性。一個“偽原創”網站在說明中稱,“‘偽原創’文章最好將文章開頭和結尾用自己的語言組織,這樣的效果更好一些”。
記者使用相似度檢測對原創和“偽原創”進行對比發現,機器識別出相似度在85%至98%之間。
記者在網站上看到一個生成記錄,內容文本字符長度為734個字的文章,共替換了44個詞長度為90個字符,替換比率為12.26%。原文和替換之后的文章相似度為92.6%,如此高的相似度怎么辦?這些網站給出了進一步的“解決方案”。
“在線生成文章,將其粘貼入前兩步已做好的‘偽原創’文章后一段即可”。記者點擊“在線生成文章”發現,生成的并不是可讀的文章,而是一段看似是中文的亂碼。將這段亂碼貼在文章最后,相似度降低到84.3%。
除了用亂碼降低相似度,這些網站介紹稱還可以在文章中插入圖片,建議用戶打亂文章順序等方法。
此外,記者發現,網上還可以搜索到大量關于“如何制作‘偽原創’”的教程。
編輯:梁霄
關鍵詞:網絡 作品 文章 工具