| سايت سير إكس | |
|---|---|
| عنوان الموقع | الموقع الرسمي (الإنجليزية) |
| نوع الموقع | أرشيف مفتوح الوصول [لغات أخرى]،وبرمجية حرة مفتوحة المصدر،ومكتبة بيانات [لغات أخرى][1] |
| ترخيص المحتوى | رخصة أباتشي 2.0[2] |
| لغة البرمجة | جافا[3] |
| تعديل مصدري -تعديل | |
سايت سير إكس (بالإنجليزية:CiteSeerX)، المعروف سابقًا باسمسايت سير (بالإنجليزية:CiteSeer)، هومحرك بحث عامومكتبة رقمية للأوراق العلمية والبحثية، خاصة في مجالاتعلومالحاسوبوعلم المعلومات.
يهدف محرك البحث سايت سير إلى تحسين النشر والوصول للمؤلفات الأكاديمية والعلمية. ويقدمها خدمة غير ربحية التي يمكن استخدامها بحرية من الجميع، واعتبر جزءاً من حركةالوصول المفتوح التي تحاول تغيير وسيلةالنشر العلمية والبحثية للسماح بوصول أكبر للمؤلفات العلمية. قدم سايت سيرالبيانات الوصفيةلمبادرة الأرشفة المفتوحة لجميع المستندات المفهرسة وروابط المستندات المفهرسة مجاناً عندما كان ذلك متاحاً لمصادر أخرى للبيانات الوصفية مثلالببليوغرافيا الرقمية ومشروع المكتبة وبوابةجمعية آلات الحوسبة لتعزيز فكرةالبيانات المفتوحة، كما يشارك بياناته لأغراض غير تجارية بموجبرخص المشاع الإبداعي.[4]
يعد سايت سير سلفاً لأدوات البحث الأكاديمية مثلجوجل سكولار ومحرك مايكروسوفت الأكاديمي.[5] تجمع محركات البحث شبيهات سايت سير عادةً وتؤرشف المستندات المتاحة للعموم في المواقع، ولا تدخل مواقع الناشرين. لهذا السبب، تكون ملفات الكُتَّاب المتاحة بشكل مجاني الأكثر تواجداً في الفهرس.
غير هذا الموقع اسمه إلى ريسيرش إنديكس (فهرس البحث) في أحد المراحل ومن ثم أعاده إلى الاسم الأول.[6]
أنشأ الباحثونلي جايلز وكيرت بولاكر وستيف لورانس محرك البحث سايت سير عام 1997 أثناء وجودهم في معهد أبحاث NEC (الآنمختبرات NEC )، فيمدينة برينستون، في نيو جيرسي في الولايات المتحدة الأمريكية. كان هدف من إنشائه هو الدخول إلى الوثائق الأكاديمية والعلمية على الويب وحصادها واستخدامفهرسة الاقتباس المستقلة للسماح بالاستعلام عن طريق الاستشهاد أو المستند، وترتيبها حسبتأثير الاستشهاد.
أصبح محرك البحث متاحاً للعموم عام 1998 وامتلك العديد من الميزات التي لم تكن متاحة في محركات البحث العادية أنذاك، وتتضمن:
حصل سايت سير علىبراءة اختراع أمريكية برقم # 6289342 ، بعنوان "فهرسة الاقتباس الذاتي وتصفح الأدب باستخدام سياق الاستشهاد " ، في 11 سبتمبر 2001. أودعت براءة الاختراع في 20 مايو 1998 ، ولها الأولوية في 5 يناير 1998. براءة اختراع مستمرة (براءة الاختراع الأمريكية رقم 6738780) في 16 مايو 2001 ، ومُنح في 18 مايو 2004.
بعد مختبرات إن أي سي الاميركية، استضافتهالشبكة العنكبوتية العالمية باسم CiteSeer.IST عام 2004 من كلية علوم وتكنولوجيا المعلومات،جامعة ولاية بنسلفانيا ، ويحوي أكثر من 700000 وثيقة. لتعزيز الوصول والأداء والبحث، تم دعم إصدارات مماثلة من سايت سير في جامعات مثلمعهد ماساتشوستس للتكنولوجياوجامعة زيورخ وجامعةسنغافورة الوطنية . ومع ذلك ، ثبت أن هذه الإصدارات من محرك البحث صعبة الصيانة ولم تعد متوفرة. نظرًا لأن سايت سير لا يقوم إلا بفهرسة الأوراق المتاحة مجانًا على الويب وليس لديه إمكانية الوصول إلى البيانات الوصفية للناشر، فإنه يعرض عددًا أقل من الاقتباسات من المواقع ، مثلالباحث العلمي من جوجل ، الذي يحتوي على بيانات تعريف للناشر.
لم يحدث سايت سير بشكل كامل منذ عام 2005 بسبب القيود في تصميمه الهندسي. كان يحتوي على عينة تمثيلية من وثائق البحث في علوم الحاسوب والمعلوماتية، ولكنه كان محدودًا في التغطية لأنه كان مقصورًا على الأوراق المتاحة للعامة، عادةً على الصفحة الرئيسية للمؤلف ، أو تلك التي قدمها المؤلف. للتغلب على بعض هذه القيود ، تم تصميم بنية معيارية ومفتوحة المصدر لـ CiteSeer - CiteSeerX.
حلCiteSeerX محل CiteSeer وأعيد توجيه جميع الاستعلامات إلى الموقع الجديد.[7] CiteSeerX هومحرك بحث عامومكتبة رقميةومستودع للأوراق العلمية والأكاديمية بشكل أساسي المتعلقة بعلومالحاسوبوعلم المعلومات.[7] فيما توسع مجال عمل محرك البحث مؤخرًا ليشمل مجالات علمية أخرى مثل الاقتصاد والفيزياء وغيرها. أُصدِر عام 2008 ، وكان يعتمد بشكل كبير على محرك بحث CiteSeer السابق والمكتبة الرقمية، كما طُوِّر ببنية أساسية جديدةمفتوحة المصدر، تعتمد على حزمة سير SeerSuite، وخوارزميات جديدة وتطبيقاتها. طورَّه الباحثان إسحاق كونسيل ولي جايلز فيكلية علوم وتقنية المعلومات، فيجامعة ولاية بنسلفانيا . وتواصل دعم الأهداف التي حددتها CiteSeer لتتبع ارتباطات وحصاد الوثائق الأكاديمية والعلمية على شبكة الويب العامة واستخدام استعلام الاقتباس من خلال الاستشهادات وترتيب المستندات حسب تأثير الاستشهادات. طوره ومازال يساهم في تطويره كل من لي جايلز وبراسينجيت ميترا وسوزان جوش ومين-ين كان وبراديب تيريجودا وخوان بابلو فرنانديز راميريز وبكتادا تريراتبيتوك وجيان وو ودوغلاس جوردان وستيف كارمان وجاك كارول وجيم يانسن وشويى زينج. في الآونة الأخيرة ،أضيفت ميزة البحث المجدول.[8] تمولهمؤسسة العلوم الوطنيةوناساوأبحاث مايكروسوفت.
مازال محرك البحث CiteSeerX يصنف ضمن أفضل مستودعات التخزين عالمياً، فيما حصد المرتبة الأولى في يوليو 2010،[9] ويملك حالياً أكثر من 6 ملايين وثيقة مع ما يقارب ستة ملايين مؤلف فريد و 120 مليون استشهاد. يشارك هذا المحرك برمجياته وبياناته وقواعدها وبياناته الوصفية مع باحثين آخرين بواسطةأمازون إس 3 و rsync.[10] صممت هيكليته وبرمجياته المعيارة مفتوحة المصدر الجديدة على Apache Solr وأدواتأباتشي الأخرى وغيرها من الأدوات مفتوحة المصدر التي تسمح باختبار الخوارزميات الجديدة في تجميع وتصنيف وفهرسة واستخلاص المعلومات. كانت برمجتمع متاحاً سابقاً علىسورس فورج لكنها نقلت وأصبحت الآن علىغيت هاب.
يخزن محرك البحث CiteSeerX بعض الملفات التي مسحها ضوئياً بصيغة كتاب إلكتروني، وتتضمن كل صفحة من الملف رابطقانون الألفية للملكية الرقمية الذي يمكن استخدامه للإبلاغ عن انتهاكات حقوق النشر.[11]
يستخدم CiteSeerX أدواتاستخراج المعلومات المؤتمتة ، والتي عادةً ما تكون مبنية على أساليب التعلم الآلي مثل ParsCit ، لاستخراج البيانات الوصفية للوثائق العلمية مثل العنوان والمؤلفين والملخص والاستشهادات وما إلى ذلك. على هذا النحو ، هناك أخطاء في بعض الأحيان في المؤلفين والعناوين. محركات البحث الأكاديمية الأخرى لديها أخطاء مماثلة.
يقوم CiteSeerX بالزحف إلى المستندات العلمية المتاحة للعموم بشكل أساسي من صفحات الويب الخاصة بالمؤلف والموارد المفتوحة الأخرى ، وليس لديه حق الوصول إلى البيانات الوصفية للناشر. على هذا النحو ، فإن عدد الاقتباسات في CiteSeerX عادة ما يكون أقل من تلك الموجودة فيجوجل سكولار و محرك البحث الأكاديمي من مايكروسوفت الذين لديهم حق الوصول إلى البيانات الوصفية للناشر.
تشارك بيانات CiteSeerX بانتظام بموجبترخيص المشاع الإبداعي غير التجاري، الترخيص بالمثل مع الباحثين في جميع أنحاء العالم، وتستخدم في العديد من التجارب والمسابقات الأخرى. بفضل نقطة التجميع لمحرك البحث CiteSeerX بالتي هي بروتوكول مبادرة الأرشيف المفتوح لحصاد البيانات الوصفية،[12] فإن هذا المحرك هو أرشيف حر وتفهرس محتوياته لتكون مستودعاً مؤسسياً لمحركات البحث الأكاديمية، على سبيل المثال مستخدمي محرك البحث BASE و Unpaywall.
لدى CiteSeerX ما يقرب من مليون مستخدم في جميع أنحاء العالم بناءً على عناوين بروتوكلات إنترنت فريدة ويحصد ملايين الزيارات يوميًا. بلغ عدد التنزيلات السنوية لملفات الكتب الإلكتروينة الخاصة بالوثائق ما يقرب من 200 مليون في عام 2015.
وُسِّع نموذج محرك البحث سايت سير ليشمل الوثائق الأكاديمية في الأعمال التجارية معSmealSearch وفي الأعمال التجارية الإلكترونية معeBizSearch. ومع ذلك ، لم يتم الحفاظ عليها من قبل رعاتهم. يمكن العثور على نسخة قديمة من كلاهما فيBizSeer.IST لكنه لم يعد في الخدمة. كما أنشئت أنظمة بحث ومستودعات أخرى تشبه سير للكيميا ،ChemX Seer وعلم الآثار ، ArchSeer. تم إنشاء ملف آخر للبحث عن ملفات robots.txt ،وهو BotSeer . كل هذه الأشياء مبنية على أداة مفتوحة المصدرSeerSuite ، والتي تستخدم مفهرس مفتوح المصدرلوسين .
{{استشهاد ويب}}:|url= بحاجة لعنوان (مساعدة) والوسيط|title= غير موجود أو فارغ (من ويكي بيانات) (مساعدة)The document with the identifier "10.1.1.604.4916" has been removed due to a DMCA takedown notice. If you believe the removal has been in error, please contact us through the feedback page, along with the identifier mentioned in this page.
{{استشهاد بدورية محكمة}}:الاستشهاد بدورية محكمة يطلب|دورية محكمة= (مساعدة)