גרידת נתונים (לעיתים נקרא:גירוד נתונים אוגרידת מידע, באנגלית:Data scraping) הוא פעולת חילוץנתונים ממאגר מידע מסוים מצד הלקוח בעזרתתוכנת מחשב[1].
לרוב המידע בצד הלקוח מוצג בצורה שקריאה לבני אדם, אך לא בצורה שמחשב יכול להבחין בין מידע רלוונטי ללא רלוונטי, ופעולה זו לוקחת את המידע הרצוי ושומרת אותו.
הנתונים הנאספים בפעולה זו בדרך כלל מאוגדים למאגר מידע חדש, ויכולים לשמש לניתוח מידע בצורה אוטומטית, חרף העובדה שאין בהכרח למקור המידעממשק תכנות יישומים.
המוכר מסוגי גרידות הנתונים הוא גרידת דפי רשת.
להלן דוגמאות לגרידות נתונים:
- דרופשיפינג ומסחר – בכדי למצוא את המחירים הנמוכים ביותר או לגלות מבצעים, לדוגמה תוכנות מסחר אשר זקוקות למחיר השוק הנוכחי בשווקים שונים יכולות למצוא את המידע באופן אוטומטי.
- מידע לאימוןבינה מלאכותית – לדוגמה השגת מידע ממאגרי מידע ברחבי המרשתת על מנת ליצורמודל שפה איכותי וקוהרנטי.
- סטטיסטיקות – יכול לשמשארגונים וממשלות לניתוח מידע בקנה מידע רחב על לקוחות או אזרחים.
- פרצת נתונים – עלול לשמש גורמים זדוניים לחילוץ מידע שלא היה אמור להיות פומבי בקנה מידע רחב.
- הגבלת כמות בקשות – לפי כמות בקשותIP וחסימת כתובות חשודות (כגון כתובות של שירותיפרוקסי ידועים).
- רנדומיזציה של הקוד בצד הלקוח – שינוי דפוסי הצגת המידע למשתמש בצורה שתקשה על ניתוח המידע.
- שימוש ב-CAPTCHA – לאחר מספר בקשות מסוים.