成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓
當前位置:工程項目OA系統(tǒng) > 泛普服務體系 > 泛普期刊
泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源
泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源
1 聚焦爬蟲技術
泛普軟件通過文獻檢索獲知:聚焦爬蟲(Focused Crawler)又稱為主題爬蟲(Topical Crawler),它的工作流程(如圖1)比傳統(tǒng)網絡爬蟲復雜一些,在抓取頁面并提取出URL以后,會根據相應的URL分析算法保留盡可能多的主題相關度高的URL,并將其放入等待抓取的URL隊列;與主題無關或相關度不高的URL將被丟棄。然后再從URL隊列里讀取URL進行抓取,并重復上述過程,直到滿足爬行停止條件為止。而且,聚集爬出的系統(tǒng)中有專門的數據庫,用來存貯被爬蟲抓取的網頁,并有專門的功能模塊對網頁進行內容分析、特征詞提取,從而建立起相應的主題特征詞庫。特征詞庫建立以后,可以更好的對之后抓取的網頁進行分析和評價,把與主題無關或相關度不高的網頁排除。
2 特定主題—OA 資源

泛普軟件通過文獻檢索獲知:Open Access即開放存取,簡稱OA,2002年2月14日發(fā)表的《布達佩斯開放存取計劃》對OA做了如下的定義:“古老的學術傳統(tǒng)和嶄新的技術已經結合起來,可能將給公眾帶來空前的利益。古老的學術傳統(tǒng)是為了接受咨詢和傳播知識的目的,在毋需付費的條件下,科學家和學者們很樂意將自己的研究成果發(fā)表于學術期刊上。嶄新的技術是英特網。這種結合可能將給公眾帶來的利益就是:經過同行評價的期刊文獻可以被所有的科學家、學者、教師、學生以及其他充滿好奇心的人在全球范圍內發(fā)布其電子文本并可以完全免費的、無限制的使用。消除對這些文獻的存取障礙將會加快研究的速度,使教育更加豐富多彩,富人與窮人之間互相共享彼此的學問,從而使這些文獻達到最大限度的利用,并在共同的理智交流和知識的追求中建立人類聯(lián)合的基礎。這種免費的無限制的聯(lián)機獲取方式,稱之為開放存取(open access)。”
Open Access是國際科技界、學術界、出版界、信息傳播界為推動科研成果利用網絡自由傳播而發(fā)起的運動。通過網絡技術,任何人可以免費的獲得各類文獻。
此文章為泛普軟件所寫,轉載請留版權,泛普軟件專注OA,OA系統(tǒng),OA辦公系統(tǒng),OA軟件,OA辦公軟件。 m.theonlineadagency.com
泛普軟件編輯
本站推薦
- 1泛普軟件頁面嵌入功能:無縫集成多元內容,打造個性化高效工作界面!
- 2泛普軟件標簽選項功能:精準分類,高效篩選,讓信息管理得心應手!
- 3泛普軟件圖片組件功能:一鍵嵌入精美圖片,瞬間提升界面視覺吸引力!
- 4泛普軟件分割線功能:巧妙劃分界面,讓信息呈現(xiàn)更清晰有序!
- 5泛普軟件富文本框功能:輕松打造專業(yè)排版,讓內容創(chuàng)作“富”有魅力!
- 6泛普軟件表格布局功能:智能定制,讓數據展示一目了然更高效!
- 7泛普軟件功能按鈕新升級:一鍵觸達,讓操作體驗流暢到飛起!
- 8泛普軟件協(xié)同鏈接功能:無縫對接團隊資源,開啟高效協(xié)作新紀元!
- 9泛普軟件樹控件功能:輕松駕馭復雜數據層級,讓管理效率飆升!

