SysNucleus WebHarvy是一款非常不錯的網(wǎng)頁數(shù)據(jù)采集器,旨在使您能夠自動從網(wǎng)頁提取數(shù)據(jù)并將提取的內(nèi)容保存為不同的格式。使用WebHarvy,從網(wǎng)頁捕獲數(shù)據(jù)就像導(dǎo)航到包含數(shù)據(jù)的頁面并單擊要捕獲的數(shù)據(jù)一樣容易。有需要的小伙伴歡迎來西西下載。
軟件簡介:
WebHarvy是一個方便的應(yīng)用程序,旨在使您能夠自動從網(wǎng)頁提取數(shù)據(jù)并將提取的內(nèi)容保存為不同的格式。使用WebHarvy,從網(wǎng)頁捕獲數(shù)據(jù)就像導(dǎo)航到包含數(shù)據(jù)的頁面并單擊要捕獲的數(shù)據(jù)一樣容易。
WebHarvy將智能地識別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。使用WebHarvy,您可以從各種網(wǎng)站(例如房地產(chǎn),電子商務(wù),學(xué)術(shù)研究,娛樂,技術(shù)等)中提取數(shù)據(jù),例如產(chǎn)品目錄或搜索結(jié)果。
從網(wǎng)頁提取的數(shù)據(jù)可以以多種格式保存。網(wǎng)頁通常在多個頁面中顯示諸如搜索結(jié)果之類的數(shù)據(jù)。WebHarvy可以自動爬網(wǎng)并從多個頁面提取數(shù)據(jù)。
軟件特征:
簡易網(wǎng)頁搜刮
WebHarvy的指向和點擊界面使Web Scraping很容易。絕對不需要編寫任何代碼或腳本來刮取數(shù)據(jù)。您將使用WebHarvy的內(nèi)置瀏覽器加載網(wǎng)站,并且可以通過單擊鼠標(biāo)來選擇要提取的數(shù)據(jù)。就這么簡單。ㄒ曨l)
智能模式檢測
WebHarvy自動識別網(wǎng)頁中出現(xiàn)的數(shù)據(jù)模式。因此,如果您需要從網(wǎng)頁上抓取項目列表(名稱,地址,電子郵件,價格等),則無需進(jìn)行任何其他配置。如果數(shù)據(jù)重復(fù),WebHarvy將自動對其進(jìn)行刮擦。 保存到文件或數(shù)據(jù)庫
您可以用多種格式保存從網(wǎng)站提取的數(shù)據(jù)。當(dāng)前版本的WebHarvy Web搜尋軟件允許您將提取的數(shù)據(jù)另存為Excel,XML,CSV,JSON或TSV文件。您也可以將抓取的數(shù)據(jù)導(dǎo)出到SQL數(shù)據(jù)庫。(了解更多)
抓取多頁
網(wǎng)站通常會在多個頁面中顯示諸如產(chǎn)品列表或搜索結(jié)果之類的數(shù)據(jù)。WebHarvy可以自動爬網(wǎng)并從多個頁面提取數(shù)據(jù)。只需指出“加載下一頁的鏈接”,WebHarvy Web Scraper就會自動從所有頁面抓取數(shù)據(jù)。(了解更多)
提交關(guān)鍵字
通過自動提交輸入關(guān)鍵字列表以搜索表單來擦除數(shù)據(jù)?梢詫⑷我鈹(shù)量的輸入關(guān)鍵字提交到多個輸入文本字段以執(zhí)行搜索?梢詮妮斎腙P(guān)鍵字所有組合的搜索結(jié)果中提取數(shù)據(jù)。(了解更多)(視頻)
保護(hù)隱私
為了匿名抓取并防止Web抓取軟件被Web服務(wù)器阻止,您可以選擇通過代理服務(wù)器或VPN訪問目標(biāo)網(wǎng)站?梢允褂脝蝹代理服務(wù)器地址或代理服務(wù)器地址列表。(了解更多)
類別抓取
WebHarvy Web抓取工具使您可以從鏈接列表中抓取數(shù)據(jù),這些鏈接會導(dǎo)致網(wǎng)站中出現(xiàn)類似的頁面/列表。這使您可以使用單一配置在網(wǎng)站內(nèi)抓取類別和子類別。(了解更多)(視頻)
常用表達(dá)
WebHarvy允許您在網(wǎng)頁的文本或HTML源上應(yīng)用正則表達(dá)式(RegEx)并抓取匹配的部分。這項功能強(qiáng)大的技術(shù)可在您抓取數(shù)據(jù)時提供更大的靈活性。(了解更多) (RegEx教程)
JavaScript支持
提取數(shù)據(jù)之前,請在瀏覽器中運行您自己的JavaScript代碼。它可用于與頁面元素進(jìn)行交互,修改DOM或調(diào)用已在目標(biāo)頁面中實現(xiàn)的JavaScript函數(shù)。(了解更多)
圖像提取
可以下載圖像或提取圖像URL。WebHarvy可以自動提取顯示在電子商務(wù)網(wǎng)站產(chǎn)品詳細(xì)信息頁面中的多個圖像。(了解更多)
自動化瀏覽器任務(wù)
WebHarvy可以輕松配置為執(zhí)行諸如單擊鏈接,選擇列表/下拉選項,向字段輸入文本,滾動頁面,打開彈出窗口等任務(wù)。
技術(shù)援助
購買WebHarvy后,您將在購買之日起的1年內(nèi)獲得我們的免費更新和免費支持。
WebHarvy入門:
1.首先,下載并安裝WebHarvy的免費試用版。
2.在此處觀看該軟件的基本演示視頻。
3.觀看更詳細(xì)的視頻教程。
4. 此處提供在線教程/功能幫助。
5.嘗試配置WebHarvy以根據(jù)您的要求提取數(shù)據(jù),如果遇到任何困難,請在此處與我們的支持聯(lián)系,并提供必要的詳細(xì)信息。
6.我們在此處的YouTube頻道中收集了大量視頻,展示了各種網(wǎng)站的配置過程和數(shù)據(jù)提取要求。