Movatterモバイル変換


[0]ホーム

URL:


לדלג לתוכן
ויקיפדיההאנציקלופדיה החופשית
חיפוש

גרידת נתונים

מתוך ויקיפדיה, האנציקלופדיה החופשית

גרידת נתונים (לעיתים נקרא:גירוד נתונים אוגרידת מידע, באנגלית:Data scraping) הוא פעולת חילוץנתונים ממאגר מידע מסוים מצד הלקוח בעזרתתוכנת מחשב[1].

לרוב המידע בצד הלקוח מוצג בצורה שקריאה לבני אדם, אך לא בצורה שמחשב יכול להבחין בין מידע רלוונטי ללא רלוונטי, ופעולה זו לוקחת את המידע הרצוי ושומרת אותו.

הנתונים הנאספים בפעולה זו בדרך כלל מאוגדים למאגר מידע חדש, ויכולים לשמש לניתוח מידע בצורה אוטומטית, חרף העובדה שאין בהכרח למקור המידעממשק תכנות יישומים.

המוכר מסוגי גרידות הנתונים הוא גרידת דפי רשת.

שימושים ודוגמאות

[עריכת קוד מקור |עריכה]

להלן דוגמאות לגרידות נתונים:

  • דרופשיפינג ומסחר – בכדי למצוא את המחירים הנמוכים ביותר או לגלות מבצעים, לדוגמה תוכנות מסחר אשר זקוקות למחיר השוק הנוכחי בשווקים שונים יכולות למצוא את המידע באופן אוטומטי.
  • מידע לאימוןבינה מלאכותית – לדוגמה השגת מידע ממאגרי מידע ברחבי המרשתת על מנת ליצורמודל שפה איכותי וקוהרנטי.
  • סטטיסטיקות – יכול לשמשארגונים וממשלות לניתוח מידע בקנה מידע רחב על לקוחות או אזרחים.
  • פרצת נתונים – עלול לשמש גורמים זדוניים לחילוץ מידע שלא היה אמור להיות פומבי בקנה מידע רחב.

דרכי מניעה

[עריכת קוד מקור |עריכה]
  • הגבלת כמות בקשות – לפי כמות בקשותIP וחסימת כתובות חשודות (כגון כתובות של שירותיפרוקסי ידועים).
  • רנדומיזציה של הקוד בצד הלקוח – שינוי דפוסי הצגת המידע למשתמש בצורה שתקשה על ניתוח המידע.
  • שימוש ב-CAPTCHA – לאחר מספר בקשות מסוים.

ראו גם

[עריכת קוד מקור |עריכה]

הערות שוליים

[עריכת קוד מקור |עריכה]
  1. ^cloudflare,What is data scraping?, cloudflare.com
אוחזר מתוך "https://he.wikipedia.org/w/index.php?title=גרידת_נתונים&oldid=40597028"
קטגוריה:

[8]ページ先頭

©2009-2025 Movatter.jp