وتشمل الخدمة الأولى وهي إنشاء وتطوير قواعد البيانات الشرعية وفهرستها وترميزها باستخدام أحدث التقنيات ما يلي:
-
مرحلة إدخال النص:
تحويل النصوص من صورة ورقية إلى صورة رقمية يمكن التعامل معها على الحاسب الآلي، وذلك عن طريق المسح الضوئي والقراءة الآلية للوثائق والمستندات، أو الإدخال اليدوي في حالة المخطوطات أو الطبعات القديمة. وفي هذه المرحلة تتم كل المعالجات اللغوية البحثية. وتختلف الحروف في اللغة العربية عن باقي اللغات الأوربية، وهذا الاختلاف له تأثير مباشر على عملية القراءة الآلية؛ فالحروف العربية متصلة كما يتغير شكل الحرف حسب موقعه في بداية أو وسط أو نهاية الكلمة. والقارئ الآلي العربي يعطي نسبة دقة تصل إلى 98% ، ويؤدي استخدام هذه التقنية إلى تخفيض الوقت بنسبة 50% . أما إذا كانت الطباعة رديئة أو قديمة فالحل يكون بالإدخال اليدوي للنصوص.
-
مرحلة مطابقة النص مع الأصل:
وذلك للتأكد من جودة إدخاله. وفي هذه المرحلة يراجع النص مع تحديد عناوينه وصفحاته وهوامشه ومراجعه ومصادره.
-
مرحلة التصحيح والتدقيق اللغوي للنصوص هجائيًّا ونحويًّا:
وفي هذه المرحلة يتم تمييز الأخطاء بلون مخالف للون النص، كما يمكن معرفة عدد الأخطاء في الوثيقة من خلال الإحصائيات. وبالوقوف على الكلمة المحددة يقترح المصحح بعض الاقتراحات التي قلما يخرج الصحيح عنها، ويلعب الباحث اللغوي دورًا أساسيًّا في تحديد الاقتراح الصحيح من خلال فهمه للسياق.
-
مرحلة ضبط النص وتشكيله:
بعد مرحلة التصحيح الآلي للكلمات والنصوص اللغوية، تأتي مرحلة التشكيل، وهي خاصية اختيارية حسب الطلب، يتم فيها وضع علامات التشكيل على الكلمات، مما يساعد القارئ على فهم النص بدقة. وتشكيل النص يكون إما تشكيلاً كليًّا أو جزئيًّا وفق ما هو مخطط ومتفق عليه.
-
مرحلة الفهرسة:
أو الهيكلة أو إنشاء فهرس محتويات النصوص من أبواب وفصول وعناوين رئيسية. ويتم تدقيق الهيكلة آليًّا قبل أن تنتقل النصوص لمرحلة الترميز، حيث يتم تكشيف (تمييز) عناصر النص. ويتم في هذه المرحلة إدخال البيانات الخاصة بحقول الفهرسة، وهي حقول يتم فيها إضافة معلومات للوثيقة، مثل: اسم المشروع، اسم الكتاب، اسم المؤلف، رقم الصفحة في الكتاب، عنوان الوثيقة، وأي معلومات أخرى ضرورية. وتستخدم هذه المعلومات في عملية البحث والفهرسة، ويتم تحديد ما إذا كانت هذه المعلومات ضرورية؛ حيث لا يمكن إرسال الوثيقة إلى المرحلة التالية قبل ملء هذه الحقول، ويمكن أن تكون هذه المعلومات اختيارية. ويمكن إضافة هذه المعلومات في مرحلة سابقة ويتم مراجعتها، كما تتم مراجعة النص الناتج عن القراءة الآلية، من خلال رابط بين الكلمة في النص وبين صورتها لتسهيل عملية المراجعة.
-
مرحلة تكشيف عناصر النص:
بواسطة هذه الأداة يتم تنسيق النص؛ العناوين والفقرات ونوع وحجم الخط، إنها محرر صفحات ويب هنا وهذا هو الأهم يتم تكشيف عناصر النص. يقوم بهذه العملية باحث يقرأ النص وعندما يجد علمًا مثلا فإنه يحدده ويضيفه إلى قائمة الأعلام، وتستخدم هذه القوائم في بناء الفهارس.
-
مرحلة الربط الموضوعي للنصوص:
وذلك باستخدام شجرة موضوعات شرعية. وفي هذه المرحلة يتم ربط الصفحات بشجرة موضوعات أعدت مسبقًا باستخدام الكلمات المفتاحية ويمكن ربط الصفحة بأكثر من موضوع ويتم ترتيب الموضوعات وتحديد نسبة مئوية لارتباطها بالموضوع. ويستطيع الباحث أن يرى الكلمات المفتاحية التي تم الربط اعتمادًا عليها بعد ذلك يتم إرسال المعلومات بعد تجهيزها إلى قواعد البيانات.