uipath数据爬取(结构化数据)
uipath數據爬取(結構化數據)為了更好地理解如何利用數據抓取功能,我們創建一個自動化項目,該項目從天貓中提取一些特定信息并將其寫入Excel電子表格。
注意:
建議在Internet Explorer 11及更高版本,Mozilla Firefox 50或更高版本或最新版本的Google Chrome上運行網絡自動化。
下面我們從天貓獲取華為手機的相關手機名稱,其URL以及價格。你可以執行以下操作:
?
???????? 3.在Studio中,創建一個New Blank Process。
???????? 4.在“ Activities”面板中,將“ OpenBrowser”活動添加到“?設計器”面板中,然后在“?URL”字段中,將網頁的URL粘貼到搜索結果中。在我們的示例中,URL是:"天貓tmall.com--理想生活上天貓"。
??? 5.在“ DESIGN”功能區選項卡的“?向導”組中,單擊“ Data Scraping”。顯示提取向導。
? 6.在Extract Wizard向導之后,點擊next,按照步驟在Web瀏覽器中選取你想要的數據字段
???7. 選中“ ExtractURL”復選框,然后將列標題的名稱更改為相關的名稱,此處為“手機名稱”。
8.單擊next。在“?預覽數據”向導步驟中顯示數據的預覽。在下圖中,可以點擊Extract Correlated data 獲取更多的數據信息,也可以設置獲取的最大數據條目數。
9.點擊FINISH。顯示“?指示下一個鏈接”窗口,提示您指示如果數據跨越一頁以上,則單擊“?下一步”按鈕或箭頭。
10.單擊yes,在下圖中對應的屬性面板中,ExtractDataTable已經自動產生。是DataTable類型
11.在“?變量”面板中,將自動生成的ExtractDataTable變量的范圍更改為Sequence。這樣做可以使變量在其當前范圍(即數據收集序列)之外可用。
12.在“ Data Scraping”序列下添加一個Excel Application Scope組件活動。
13.在“?Excel應用程序范圍”活動的“?屬性”面板中的“?工作簿路徑”字段中輸入excel地址,或者在下圖紅圈中點擊輸入一個已經創建好的excel表格。
14.在“?Excel Application Scope”活動的“ do”序列中,添加“?寫入范圍”活動,然后在“?屬性”面板中:
- 在數據表字段中,添加ExtractDataTable變量。
- 選中“?AddHeaders”復選框,以在輸出中包括列名稱。
15.最終項目應如以下屏幕截圖所示:
最后按run執行項目。
參考英文文檔鏈接:Example of Using Data Scraping
?
總結
以上是生活随笔為你收集整理的uipath数据爬取(结构化数据)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: foobar2000在线标签服务器,不再
- 下一篇: MySQL 数据库规范