Movatterモバイル変換


[0]ホーム

URL:


לדלג לתוכן
ויקיפדיההאנציקלופדיה החופשית
חיפוש

ויקינתונים

מתוך ויקיפדיה, האנציקלופדיה החופשית
ויקינתונים
Wikidata
סוגמסד נתוניםסמנטי,חופשי,שיתופי ורב-לשוני
סלוגןthe free knowledge base that anyone can editעריכת הנתון בוויקינתונים
תקופת הפעילות29 באוקטובר 2012 – הווה (12 שנים)עריכת הנתון בוויקינתונים
מייסדיםדני ורנדצ'יץ', מרקוס קרוטש,קרן ויקימדיהעריכת הנתון בוויקינתונים
בעלותקרן ויקימדיהעריכת הנתון בוויקינתונים
wikidata.org
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

ויקינתוניםאנגלית:Wikidata) הואמסד נתוניםסמנטי,חופשי,שיתופי ורב-לשוני, השייך לקרן ויקימדיה. ויקינתונים משמש כמאגרנתונים מרכזי לכל המיזמים של קרן ויקימדיה, וניתן לעשות בנתונים שבו שימוש חופשי ברישיוןנחלת הכלל.

מהות המיזם

[עריכת קוד מקור |עריכה]

בדומה למיזםויקישיתוף שמרכז את קובצי המדיה בהם נעשה שימוש במיזמי קרן ויקימדיה והמופצים ברישיון חופשי, ויקינתונים משמש כמאגרנתונים מרכזי וחופשי. ניתן להשתמש בנתונים בצורות שונות – ניתן להעתיק, לשנות, להפיץ או להציג את הנתונים, אפילו למטרות מסחריות, כל זאת מבלי לבקש רשות. כמו בשאר מיזמי קרן ויקימדיה, הנתונים בוויקינתונים מוכנסים ומתוחזקים על ידי העורכים שמחליטים על הכללים שליצירת תוכן וניהול המידע. עם זאת, גםבוטים יכולים להזין נתונים בוויקינתונים. ויקינתונים אוגר נתונים מובנים ומקושרים, דבר המקל על שימוש חוזר בנתונים, ומאפשר שימוש ועיבוד על ידי מחשבים.

ויקינתונים מהווה מאגר נתונים מרכזי עבורויקיפדיה בשפות השונות, כמו גם לשאר מיזמיקרן ויקימדיה. ויקינתונים תומך בוויקיפדיה בקישורי שפה, כלומר, ערכים מקבילים בוויקיפדיות בשפות שונות מקושרים ביניהם באמצעות ויקינתונים. בנוסף, פרטי מידע רבים (כגון תאריכי הלידה או נתוני התמ"ג של מדינות) מאוחסנים במאגר וניתן לעשות בהם שימוש בתבניות מידע או בתבניות רגילות המופיעות בוויקיפדיות השונות ובמיזמים נוספים. באופן זה מתאפשר לעדכן נתונים במקביל בכל הערכים במהדורות השונות של ויקיפדיה ובמיזמים אחרים של קרן ויקימדיה או של גופים אחרים, וליצור סינרגיה בין השפות השונות, דבר המקל על התחזוקה של ערכים, מצמצם את עומס העבודה, ומשפר את איכותה, מהימנותה ועדכניותה של ויקיפדיה.

מבנה ויקינתונים

[עריכת קוד מקור |עריכה]

ויקינתונים פועל עלתוכנת Wikibase – מקבץ שלתוספים למדיה-ויקי[1] – והואמסד נתונים גרפי בפורמטRDF.

פריטים

[עריכת קוד מקור |עריכה]

מסד הנתונים מתמקד בפריטים (Items), שיכולים לייצג כל נושא, מושג, אובייקט או ישות. הפריט הוא ישות מוגדרת שמתוארת באמצעות מכלול נתונים קונקרטיים. לדוגמה,‏אולימפיאדת סיאול 1988‏(Q8470),‏אהבה‏(Q316),‏אלביס פרסלי‏(Q303) או‏גורילה‏(Q36611).

לכל פריט מספר מזהה ייחודי מחויב המתחיל באות Q ומכונה QID. התווית (label) של הפריט היא השם המקובל לפריט בשפה מסוימת, וניתן להזין תווית בכל שפה נתונה. בצורה זו ניתן לזהות את הפריט ולהציג מידע בסיסי בעבורו בצורה שאינה מעניקה עדיפות לשפה אחת על פני השנייה.

תוויות של פריטים לא מוכרחות להיות ייחודיות. למשל,‏מורה‏(Q37226),‏מורה‏(Q521164),‏מורה‏(Q204040), ו-‏מורה‏(Q849874) הם פריטים המתייחסים לישויות שונות בתכלית: הראשון הוא אדם העוסק בהוראה, השני יחידה פונולוגית, השלישי נהר במרכז אירופה והרביעי עיירה בשוודיה.

בעיקרון, כל פריט מורכב מתווית, תיאור ומספר קביעות (statements).

התרשים מראה את המונחים והמושגים החשובים ביותר בוויקינתונים

קביעוֹת

[עריכת קוד מקור |עריכה]

מידע על פריטים מאורגן בצורה של קביעות. באופן פורמלי, אלה הן הצהרות המורכבות מצמדים שלמאפיין (property) וערך (value) אחד, או מאפיין ומספר רב של ערכים. למאפיין יהיה מזהה ייחודי שמתחיל ב-P.

למשל, בעבור הפריט‏אוורסט‏(Q513), המאפיין‏שיא גובה‏(P2660) יקבל את הערך 8,848 מטר; בעבור הפריט‏שרלוק הולמס‏(Q4653), המאפיין‏יוצר‏(P170) יקבל את הערך‏ארתור קונאן דויל‏(Q35610) – שהוא פריט ויקינתונים בפני עצמו. מאפיינים יכולים לקבל ערכים מסוגים שונים: מספרים, תאריכים,מחרוזות (למשל,‏שם בשפת אם‏(P1559)), קובצי מדיה (למשל,‏תמונה‏(P18)), פריטים אחרים בוויקינתונים ועוד.

לכל מאפיין נקבע סוג הערכים שהוא יכול לקבל. למשל, המאפיין‏אתר רשמי‏(P856) צריך לקבל ערך מהסוגURL. מאפיינים יכולים גם להגדיר אילוצים (constraints) - כללים מורכבים יותר לגבי השימוש המיועד שלהם. לדוגמה, למאפיין‏עיר בירה‏(P36) יש "אילוץ חד-ערכי", המשקף את המציאות כי לטריטוריות יש (בדרך כלל) רקעיר בירה אחת. עם זאת, המודל של ויקינתונים גמיש מאוד: היחס לאילוצים אינו כאל כללים שאין להפר אותם אלא כהכוונה לעורכים[2].

קביעות יכולות למפות מאפיין אחד ליותר מערך אחד. למשל, המאפיין של‏עיסוק‏(P106) יקבל אצלמארי קירי הן את הערך‏פיזיקאי‏(Q169470) והן את הערך‏כימאי‏(Q593644).

בתחילת 2022 היו קיימים קרוב לעשרת אלפים מאפיינים בויקינתונים. מאפיין חדש יכול להיווצר רק לאחר דיון עם הקהילה בדף המתאים.

מבחינים הם דרך אופציונלית שבה ניתן לשפר דיוק של קביעה כלשהי על ידי הוספת מידע בנוגע להיקפה. למשל, המאפיין‏אוכלוסייה‏(P1082) יכול לקבל ערך מספרי מסוים, וניתן לשפר את דיוק הקביעה ולציין במגדיר‏נקודת זמן‏(P585) את הערך "שנת 2017".

צילום מסך מאפיין ויקינתונים

דוגמה נוספת. בפריט הספר‏מורה נבוכים‏(Q1140185), יועלה דיוק המאפיין‏מתרגם‏(P655) שתוכנו‏מיכאל שורץ‏(Q7063198) באמצעות המבחין‏השפה של היצירה או של השם‏(P407) לשפת התרגום‏עברית‏(Q9288).

קביעות יכולות גם לכלול הפניה למקורות כדי לתת סימוכין לקביעה. לקביעה ממוסמכת יש יותר תוקף מקביעה שאין לה מקורות. ישנן קביעות שחייבות סימוכין.

קביעות יכולות להיות מדורגות בשלושה דירוגים: מועדף, רגיל וירוד.ברירת המחדל ביצירת הקביעה היא דירוג רגיל. הדירוג מיוצג בצורת אייקון בשורת הערך ובצבע הרקע של הקביעה (ירוק למועדף, לבן לרגיל וורוד לירוד).

לקסמה (יחידה מילונית)

[עריכת קוד מקור |עריכה]
תרשים של הלקסמות

בבלשנות, לקסמה היא יחידהסמנטית (בעלת משמעות מילונית). באופן דומה, הלקסמות של ויקינתונים הן פריטים בעלי מבנה שהופך אותם למתאימים יותר לאחסון נתונים לקסיקוגרפיים כמו מילים, ביטויים ומשפטים, בכדי למפות בשפהאטימולוגיה, הטיות וכו'. חלק זה שעוסק בשפות אמור להשתלב בויקימילון.

היסטוריה ופיתוח

[עריכת קוד מקור |עריכה]
צוות המפתחים של ויקינתונים
סמליל מיוחד שעיטר את אתר האינטרנט של המיזם ב-2014, בשבוע בו חגג ויקינתונים שנתיים להשקתו

המיזם נוצר ביוזמתויקימדיה גרמניה, ובמימון מענקים מהמכון לבינה מלאכותית שלפול אלן, מקרן גורדון ובטי מור, ומגוגל, בסך של 1.3 מיליוןאירו[3][4]. זהו המיזם החדש הראשון של קרן ויקימדיה מאז 2006. פיתוח המיזם נעשה בעיקר על ידי ויקימדיה גרמניה וכלל שלושה שלבים:

  1. ריכוז קישורים בין-לשוניים - קישורים בין ערכים בוויקיפדיה על אותו נושא בשפות שונות
  2. אחסון מרכזי לנתונים שבתבניות מידע מכל הוויקיפדיות
  3. יצירה ועדכון של רשימות ערכים על סמך נתונים בוויקינתונים

השקה ראשונית

[עריכת קוד מקור |עריכה]

המיזם הושק באופן רשמי ב-30 באוקטובר 2012 וכלל תחילה רק קישורים בין-לשוניים. בעבר, כל ערך בוויקיפדיה כלל רשימה של קישורים לערך המקביל בוויקיפדיות אחרות. ויקינתונים היווה בשלב ראשון מאגר מרכזי של קישורים אלה: כל פריט שנוצר בוויקינתונים הכיל רק מידע בסיסי: תווית, תיאור וכינויים (תוויות אלטרנטיביות) וקישורים לערכים בנושא בוויקיפדיות השונות.

המהדורה הראשונה של ויקיפדיה שבה שולבו קישורים בין-לשוניים דרך מסד הנתונים של ויקינתונים הייתה ויקיפדיה ההונגרית, שבה שולבו הקישורים ב-14 בינואר 2013. קישורים בין-לשוניים דרך ויקינתונים נכנסו לשימוש לאחר מכן בוויקיפדיה העברית וויקיפדיה האיטלקית, ב-30 בינואר2013[5], ב-11 בפברואר 2013 בוויקיפדיה האנגלית, -ב-6 במרץ 2013 בכל שאר הוויקיפדיות.

הוספת קביעות

[עריכת קוד מקור |עריכה]

ב-4 בפברואר 2013 החלה הוספת הקביעות לוויקינתונים. הנתונים יובאו בחלקם בצורה אוטומטית מתבניות מידע וקטגוריות שבערכי ויקיפדיה. ב-27 במרץ 2013 החלו השילוב של ויקינתונים - תחילה ב-11 ויקיפדיות, ומ-23 באפריל בכל המהדורות בשפות השונות של ויקיפדיה. ב-22 ביולי2013 מסד הנתונים השתלב עם המהדורות השונות של מיזם "ויקימסע" וב-14 בינואר2014 השתלב גם עםויקיטקסט.

שליפת מידע

[עריכת קוד מקור |עריכה]

החל מהשלב השלישי של הפיתוח ניתן לייצר רשימות אוטומטיות של נתונים ולייצאם. ב-7 בספטמבר 2015, קרן ויקימדיה הכריזה על השקת ממשק השאילתות של ויקינתונים[6] המאפשר למשתמשים לתשאל את מסד הנתונים באמצעותSPARQL. שירות זה מאפשר למשתמשים לקבל תשובות לסוגים שונים של שאלות, כגון "מהן עשר הערים הגדולות בעולם בהן מכהנת אישה בתפקידראש העיר"[4], "באיזה יצירות אמנות מופיעמגדל אייפל" או "כמה אנשים קיבלו גםפרס אוסקר וגםפרס נובל".

נכון לנובמבר 2018, יש לפחות 26 כלים שונים המאפשרים לתשאל את ויקינתונים הנתונים בדרכים שונות[7].

סמליל המיזם

[עריכת קוד מקור |עריכה]

סמלילו של ויקינתונים הואברקוד המכיל את המילה "ויקי" בקוד מורס.

קישורים חיצוניים

[עריכת קוד מקור |עריכה]
מיזמיקרן ויקימדיה
ויקישיתוף תמונות ומדיה בוויקישיתוף:ויקינתונים

הערות שוליים

[עריכת קוד מקור |עריכה]
  1. ^Wikibase — Home, wikiba.se
  2. ^Help:Property constraints portal - Wikidata, www.wikidata.org
  3. ^Paul Allen Invests In A Massive Project To Make Wikipedia Better - Business Insider
  4. ^12Wikipedia’s Next Big Thing: Wikidata, A Machine-Readable, User-Editable Database Funded By Google, Paul Allen And Others | TechCrunch
  5. ^אמיר אהרוני, מהיום: ויקינתונים מופעל גם בוויקיפדיה העברית והאיטלקית, באתר ויקימדיה ישראל.
  6. ^Query Service, query.wikidata.org
  7. ^Wikidata:Tools/Query data - Wikidata, www.wikidata.org


מיזמיקרן ויקימדיה
ויקיפדיהויקימילוןויקיטקסטויקיציטוטויקישיתוףויקיספרויקיחדשותויקימסעויקיברסיטהויקימיניםויקינתוניםויקיפונקציותהלוגו של קרן ויקימדיה
בקרת זהויותעריכת הנתון בוויקינתונים

גילוי נאות: ערך זה מזכיר אתקרן ויקימדיה או את אחד המיזמים שלה.ויקיפדיה היא מיזם של קרן ויקימדיה.

אוחזר מתוך "https://he.wikipedia.org/w/index.php?title=ויקינתונים&oldid=40617265"
קטגוריות:
קטגוריות מוסתרות:

[8]ページ先頭

©2009-2025 Movatter.jp