ใช้คำสั่ง Extract data from web page คำสั่งนี้วิธีการใช้งานจะต่างจาก action อื่นๆ โดยเมื่อเราลากคำสั่งมาวางแล้ว ต้องสลับไปที่หน้าจอที่ต้องการ extract ข้อมูลเอง
เราจะใช้เว็บไซต์ List of most-watched Netflix original programming โดยในเว็บไซต์นี้จะมีตารางที่เราสนใจ 2 ตาราง
- ตารางที่ 1 จะดึงข้อมูลมาทั้งหมด
- ตารางที่ 2 จะดึงข้อมูลมาแค่ 2 คอลัมน์
Launch new Chrome
Launch mode: Launch new Instance
Initial URL: https://en.wikipedia.org/wiki/List_of_most-watched_Netflix_original_programming

Extract data from web page 1
คำสั่งนี้จะใช้ดึงค่าในตารางที่ 1 ทั้งหมดออกมา ให้ลากคำสั่งนี้มาวางที่ workspace แล้วไปที่หน้าเว็บไซต์ เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของตาราง แล้วคลิกขวา เลือก Extract entire HTML table

Web browser instance: Browser variable
Store data mode: Variable

หมายเหตุ Store data mode สามารถเปลี่ยนเป็น Excel spreadsheet แล้วไป save as Excel file ได้
Check Result (Table 1)
กดรันแล้วดูผลลัพธ์ จะได้ 15 Rows, 6 columns (ข้อมูลวันที่ 17 May 2024)

Double click ที่ตัวแปร DataFromWebPage จะได้ข้อมูลตามด้านล่าง ซึ่งข้อมูลมาครบ แต่โรบอทอ่านพวก merge cell ในตารางไม่ค่อยได้

ดังนั้นถ้าใครจะใช้วิธีนี้ก็ลองเช็คข้อมูลให้ดีๆ ก่อนนำไปใช้ต่อนะคะ
Extract data from web page 2
คำสั่งนี้จะใช้ดึงค่าในตารางที่ 2 ออกมาบางส่วน เราจะใช้คำสั่งเดิม คือ Extract data from web page แต่จะไปดึงข้อมูลตารางที่ 2 โดยเอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Title ที่บรรทัดที่ 1)

เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Title ที่บรรทัดที่ 2)

โปรแกรมจะหา pattern ของเว็บไซต์ในอัตโนมัติ เราก็จะได้ข้อมูลในคอลัมน์ Title (ในหน้าจอ Live web helper จะแสดง Extraction preview ของข้อมูลใน

เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Hours watched ที่บรรทัดที่ 1)

โปรแกรมจะหา pattern ของเว็บไซต์ในอัตโนมัติ เราก็จะได้ข้อมูลในคอลัมน์ Hour watched (ในหน้าจอ Live web helper จะแสดง Extraction preview ของข้อมูลใน Hour watched และที่เว็บไซต์จะมีเส้นประรอบข้อมูลที่ดึงค่ามา)

Check Result (Table 2)
กดรันแล้วดูผลลัพธ์ จะได้ 21 Rows, 2 columns (ข้อมูลวันที่ 5 Jun 2024)

Double click ที่ตัวแปร DataFromWebPage2 จะได้ข้อมูลตามด้านล่าง ซึ่งข้อมูลมาไม่ครบ (หายไป 1 ค่า)

ลองกลับมา edit แล้วดูข้อมูลใน Live web helper ก็จะเห็นว่าไม่สามารถดึงข้อมูลได้จริงๆ เนื่องจาก HTML เป็นคนละ tag กัน


ในกรณีนี้ให้แก้ไขโดยไป Extract ข้อมูลมาใหม่ โดยให้คลิกไปที่ table cell ของคอลัมน์ Title

แล้วรันใหม่อีกครั้งจะได้ผลลัพธ์ตามด้านล่าง

Completed flow

สามารถ download source code ของบทความนี้ได้ที่ github แล้ววางใน Workspace ของ Power Automate Desktop ได้เลย
Video


Leave a comment