ดึงค่าจากตารางบนเว็บไซต์

by

ใช้คำสั่ง Extract data from web page คำสั่งนี้วิธีการใช้งานจะต่างจาก action อื่นๆ โดยเมื่อเราลากคำสั่งมาวางแล้ว ต้องสลับไปที่หน้าจอที่ต้องการ extract ข้อมูลเอง

เราจะใช้เว็บไซต์ List of most-watched Netflix original programming โดยในเว็บไซต์นี้จะมีตารางที่เราสนใจ 2 ตาราง

  • ตารางที่ 1 จะดึงข้อมูลมาทั้งหมด
  • ตารางที่ 2 จะดึงข้อมูลมาแค่ 2 คอลัมน์

Launch new Chrome

Launch mode: Launch new Instance

Initial URL: https://en.wikipedia.org/wiki/List_of_most-watched_Netflix_original_programming

Extract data from web page 1

คำสั่งนี้จะใช้ดึงค่าในตารางที่ 1 ทั้งหมดออกมา ให้ลากคำสั่งนี้มาวางที่ workspace แล้วไปที่หน้าเว็บไซต์ เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของตาราง แล้วคลิกขวา เลือก Extract entire HTML table

Web browser instance: Browser variable

Store data mode: Variable

หมายเหตุ Store data mode สามารถเปลี่ยนเป็น Excel spreadsheet แล้วไป save as Excel file ได้

Check Result (Table 1)

กดรันแล้วดูผลลัพธ์ จะได้ 15 Rows, 6 columns (ข้อมูลวันที่ 17 May 2024)

Double click ที่ตัวแปร DataFromWebPage จะได้ข้อมูลตามด้านล่าง ซึ่งข้อมูลมาครบ แต่โรบอทอ่านพวก merge cell ในตารางไม่ค่อยได้

ดังนั้นถ้าใครจะใช้วิธีนี้ก็ลองเช็คข้อมูลให้ดีๆ ก่อนนำไปใช้ต่อนะคะ

Extract data from web page 2

คำสั่งนี้จะใช้ดึงค่าในตารางที่ 2 ออกมาบางส่วน เราจะใช้คำสั่งเดิม คือ Extract data from web page แต่จะไปดึงข้อมูลตารางที่ 2 โดยเอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Title ที่บรรทัดที่ 1)

คลิกที่ Title อันดับที่ 1

เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Title ที่บรรทัดที่ 2)

คลิกที่ Title อันดับที่ 2

โปรแกรมจะหา pattern ของเว็บไซต์ในอัตโนมัติ เราก็จะได้ข้อมูลในคอลัมน์ Title (ในหน้าจอ Live web helper จะแสดง Extraction preview ของข้อมูลใน

โปรแกรมหา pattern ให้อัตโนมัติ (Title)

เอาเมาส์ไปวางให้ขึ้นกรอบสีแดงของข้อมูลที่สนใจ คลิกขวา เลือก Extract element value > Text (ในที่นี้จะเลือกข้อมูลในคอลัมน์ Hours watched ที่บรรทัดที่ 1)

คลิกที่ Hour watched อันดับที่ 1

โปรแกรมจะหา pattern ของเว็บไซต์ในอัตโนมัติ เราก็จะได้ข้อมูลในคอลัมน์ Hour watched (ในหน้าจอ Live web helper จะแสดง Extraction preview ของข้อมูลใน Hour watched และที่เว็บไซต์จะมีเส้นประรอบข้อมูลที่ดึงค่ามา)

โปรแกรมหา pattern ให้อัตโนมัติ (Hour watched)

Check Result (Table 2)

กดรันแล้วดูผลลัพธ์ จะได้ 21 Rows, 2 columns (ข้อมูลวันที่ 5 Jun 2024)

Double click ที่ตัวแปร DataFromWebPage2 จะได้ข้อมูลตามด้านล่าง ซึ่งข้อมูลมาไม่ครบ (หายไป 1 ค่า)

ลองกลับมา edit แล้วดูข้อมูลใน Live web helper ก็จะเห็นว่าไม่สามารถดึงข้อมูลได้จริงๆ เนื่องจาก HTML เป็นคนละ tag กัน

ในกรณีนี้ให้แก้ไขโดยไป Extract ข้อมูลมาใหม่ โดยให้คลิกไปที่ table cell ของคอลัมน์ Title

แล้วรันใหม่อีกครั้งจะได้ผลลัพธ์ตามด้านล่าง

Completed flow

สามารถ download source code ของบทความนี้ได้ที่ github แล้ววางใน Workspace ของ Power Automate Desktop ได้เลย

Video

Did You Enjoy this Article?

Subscription to get new articles sent to your inbox each week for FREE

Question?

If you have any questions or feedback about this article please leave a message in the comments section below.

Subscribe to get new articles sent to your inbox each week for FREE