ผู้เชี่ยวชาญของ Semalt บอกว่าการคัดลอกข้อมูลบนเว็บได้รับการรับรองโดยศาล

ในขณะที่การขูดข้อมูลจากเว็บไซต์อาจผิดกฎหมายโดยไม่ได้รับอนุญาตจากเจ้าของเว็บไซต์ แต่ผู้พิพากษาได้ตัดสินเมื่อไม่นานมานี้ในบางสถานการณ์ hiQ Labs เพิ่งยื่นฟ้อง LinkedIn เพื่อป้องกันไม่ให้พวกเขาดึงข้อมูลจากหน้า LinkedIn

มันเป็นเรื่องที่น่าตกใจสำหรับคนส่วนใหญ่ที่ LinkedIn ได้รับคำสั่งให้เปิดใช้งานหน้าเว็บฟรีของตน hiQ ใช้อัลกอริทึมในการตรวจจับเมื่อผู้ใช้ LinkedIn กำลังมองหางานตามการเปลี่ยนแปลงที่ผู้ใช้ทำกับโปรไฟล์สาธารณะของเขา / เธอ

อัลกอริทึมทำงานกับข้อมูลที่ดึงมาจากหน้าเว็บ LinkedIn อย่างที่คาดไว้ LinkedIn ไม่ชอบและมีมาตรการตอบโต้เพื่อป้องกัน hiQ จากการดึงข้อมูลเพิ่มเติม นอกเหนือจากสิ่งกีดขวางทางเทคนิคที่เกิดขึ้นแล้วยังมีการออกคำเตือนทางกฎหมายอย่างรุนแรงเช่นกัน

การเริ่มต้นไม่มีทางเลือกนอกจากต้องดำเนินการให้ถูกต้องตามกฎหมาย hiQ ต้องหาทางแก้ไขทางกฎหมาย บริษัท ต้องการให้ LinkedIn สั่งให้ลบอุปสรรคทางเทคนิคออก hiQ ยังต้องการให้กระบวนการสกัดข้อมูลบน LinkedIn ถูกต้องตามกฎหมาย

โชคดีสำหรับการเริ่มต้นมันได้สิ่งที่ต้องการ คดีนี้เป็นที่นิยมของ hiQ LinkedIn ได้รับคำสั่งให้ลบมาตรการกีดกันการขัดขวาง hiQ ทั้งหมดออกจากการขูดหน้าเว็บ (LinkedIn) และให้มือฟรี hiQ เนื่องจากการกระทำนั้นถูกกฎหมายอย่างสมบูรณ์ ผู้พิพากษาตัดสินคดีของเขาจากข้อเท็จจริงที่ว่าสิ่งที่ hiQ ต้องการที่จะขูดเป็นข้อมูลที่ได้รับการแสดงเพื่อการดูสาธารณะ

ผู้พิพากษาไม่เพียง แต่สั่งให้จำเลยถอดกลไกป้องกันทั้งหมดที่วางไว้ออกมาต่อต้าน hiQ แต่เขายังสั่งให้จำเลยเลิกการกระทำดังกล่าวในอนาคต

โปรโมตข้อมูลเว็บแบบเปิด

ในขณะที่การพิจารณาคดียังคงเป็นคำสั่งห้ามชั่วคราว แต่ก็เป็นเรื่องที่น่ายินดีที่ได้ยินว่ากฎหมายรองรับข้อมูลเว็บแบบเปิดและการเข้าถึงข้อมูลบนอินเทอร์เน็ตได้ฟรีเนื่องจากการพิจารณาคดีนี้ยืนยันว่า แม้ว่าการตัดสินใจขั้นสุดท้ายจะได้รับการสนับสนุนจากจำเลยความจริงข้อนี้ได้ถูกจัดตั้งขึ้นแล้ว

ผู้พิพากษาเลื่อนระดับนโยบายนี้โดยปิดการโต้แย้งของ LinkedIn เกือบทั้งหมด ในขณะที่ LinkedIn พยายามยืนยันว่าโจทก์ละเมิดความเป็นส่วนตัวของตนผู้พิพากษาโต้กลับด้วยข้อเท็จจริงที่ว่าจำเลยกำลังขายข้อมูลเช่นกัน

เมื่อการโต้แย้งไม่ได้ระงับน้ำจำเลยยังระบุด้วยว่าการกระทำของ hiQ เป็นการละเมิดขั้นต้นของพระราชบัญญัติการทุจริตคอมพิวเตอร์และการละเมิด (CFAA) เนื่องจากการเริ่มต้นเข้าถึงเซิร์ฟเวอร์ของพวกเขาเพื่อทำการเก็บข้อมูลอย่างผิดกฎหมาย อีกครั้งอาร์กิวเมนต์ถูกเจาะทะลุ มีการปฏิเสธบนพื้นว่า hiQ เป็นเพียงการคัดลอกเนื้อหาในหน้าเว็บสาธารณะที่ไม่มีการป้องกัน

ผู้พิพากษาเปรียบเทียบคดีในขณะที่บางคนกำลังเดินเข้าไปในร้านเปิดในช่วงเวลาทำการ บุคคลเช่นนี้ไม่สามารถถูกกล่าวได้ว่าเป็นการล่วงละเมิด ดังนั้น hiQ ไม่ใช่การบุกรุก น่าสนใจผู้พิพากษาอธิบายเพิ่มเติมว่าทำไมการพิจารณาคดีของเขาจึงอยู่ในความสนใจของสาธารณชน

สรุปศาลยอมรับว่ามันอยู่ในความสนใจของประชาชนเพื่อให้ข้อมูลที่จะรวบรวมข้อมูลสกัดและวิเคราะห์ ดังนั้นมันจะเป็นนโยบายที่เป็นอันตรายเพื่อส่งเสริมการวางอุปสรรคในการไหลของข้อมูล

สิ่งที่คุณควรเรียนรู้จากการพิจารณาคดี

แม้ว่าคุณอาจไม่มีเหตุผลในการดึงข้อมูลโดยตรงจาก LinkedIn คุณควรเรียนรู้จากการพิจารณาคดี เป็นการดีกว่าที่จะเล่นอย่างปลอดภัยโดยการอ่านและเคารพไฟล์ robots.txt ของเว็บไซต์ทั้งหมด โปรดจำไว้ว่าการพิจารณาคดียังคงเป็นคำสั่งห้ามชั่วคราว ในที่สุดมันก็สามารถเข้ากับ LinkedIn ได้

ในขณะที่การพิจารณาคดีอาจไม่ส่งผลกระทบต่อคุณโดยตรงมันเป็นเรื่องน่ายินดีที่ศาลรัฐบาลกลางสนับสนุนนโยบายในการเปิดเว็บให้กับสาธารณะ ดังนั้นข้อมูลควรพร้อมใช้งานและเข้าถึงได้สำหรับผู้ที่สามารถค้นหาและใช้ประโยชน์จากมันได้

ข้อมูลบนเว็บมีประโยชน์อย่างยิ่งสำหรับทุกคนโดยเฉพาะนักวิเคราะห์สื่อนักพัฒนานักวิทยาศาสตร์ด้านข้อมูลและผู้เชี่ยวชาญอื่น ๆ การพิจารณาคดีเป็นการพัฒนาที่น่ายินดี

mass gmail