การดึงข้อมูลที่ต้องการจากเว็บไซต์ด้วยภาษาไพทอน (Data Science) วิทยาการคำนวณ ม.5

ในวิชาวิทยาการคำนวณ ม.5 มีตัวชี้วัดวิทยาการคำนวณ หรือ ว.4.2 อยู่เพียงข้อเดียวครับ ว4.2 ม.5/1 รวบรวม วิเคราะห์ข้อมูล และใช้ความรู้ด้านวิทยาการคอมพิวเตอร์ สื่อดิจิทัล เทคโนโลยีสารสนเทศในการแก้ปัญหาหรือเพิ่มมูลค่าให้กับบริการหรือผลิตภัณฑ์ที่ใช้ในชีวิตจริงอย่างสร้างสรรค์ ซึ่งพูดง่ายๆ ก็คือนักเรียนจะต้องรวบรวมข้อมูลมาวิเคราะห์และนำเสนอเพื่อให้ผู้อ่านเข้าใจได้ทันทีว่าข้อมูลเหล่านั้นหมายถึงอะไร พร้อมกับนำไปแก้ปัญหาหรือเพิ่มมูลค่ากับสิ่งที่ต้องการได้ครับ สำหรับผมแล้วการวิเคราะห์ข้อมูลหรือประมวลผลนั้นไม่ค่อยยากเท่าไหร่ เพราะเรามีโปรแกรมช่วยเยอะ ทั้ง Excel SPSS หรือ Tableau ครับ แต่กระบวนการในการได้มาซึ่งข้อมูลที่ต้องการนั้นเป็นสิ่งสำคัญ เช่น ถ้าเราต้องการถึงข้อมูลจำนวนมากจากเว็บไซต์หนึ่ง เราจะมีวิธีการอย่างไรจึงจะสะดวกที่สุด และข้อมูลนั้นอยู่ในรูปที่สามารถนำมาประมวลผลได้ง่าย ในบทความนี้ผมจะอธิบายและยกตัวอย่างการทำ Web Scraping ซึ่งเป็นกระบวนการรวบรวมข้อมูลจากเว็บไซต์ใดๆ ที่ได้มาจากการอบรมครูแกนนำวิทยาการคำนวณ ม.ปลาย ครับ คุณครูลองทำตามเอกสารที่แนบมาดังนี้ได้เลยนะครับ ตัวอย่างที่เขียนมาจะเป็นการดึงข้อมูลภาพยนตร์จากเว็บไซต์ imdb.com 250 อันดับแรกที่ได้รับความนิยมสูงสุด โดยเลือกที่จะดึงชื่อ ปีที่ฉาย และเรทติ้งครับ (โค้ดอยู่ด้านล่างนะ) หมายเหตุ ครูควรทดลองทำการดึงข้อมูลหลายๆ รูปแบบเพื่อให้เกิดความเข้าใจ และควรแนะนำหรือสอน HTML Element ด้วยนะครับ http://www.nattapon.com/wp-content/uploads/2019/07/เอกสารแนะนำการรวบรวมข้อมูลด้วย-Web-Scrapping.pdf  

Read More
Back To Top