سازماندهي دانش عبارت است از توصيف و سازماندهي محتوا، ويژگيها، و اهداف اسناد بهگونهاي كه براي كساني كه در جستوجوي اين اسناد يا پيامهاي نهفته در آنها هستند، دسترسپذير شوند. سازماندهي دانش، همه انواع و شيوههاينمايهسازي، چكيده و چكيدهنويسي، ردهبندي، گسترشها در ايران، فهرستنويسي، مديريت مدارك، كتابشناسي، و ايجاد پايگاههاي اطلاعاتي متني و كتابشناختي براي بازيابي اطلاعات را دربر ميگيرد.
پيامها از طريق خلق متون ارائه ميشوند. منظور از متن، مجموعه سازمانيافتهاي از علائم است كه با بهكارگيري نظامهاي ويژه بهمنظور ارائه زبان، موسيقي، تصاوير، پديدههاي علمي و رياضي، رقص، و بسياري ديگر از اشكال هنر و ارتباطات ايجاد ميشوند. متون، گونههاي مختلف دارند و در رسانههاي گوناگون ثبت و ضبط ميشوند. تلفيق متن (كه ارائه دهنده پيام است) به همراه رسانه آن يك سند را تشكيل ميدهد. از اينرو، سند (يعني پيام ارائه شده در يك متن مضبوط در يك رسانه) محور توجه بيشتر نظامهاي سازماندهي دانش براي بازيابي اطلاعات است.
مقرّ دانش، ذهن انسان است. انسانها آموختهاند كه چگونه دانش را در قالب پيامهاي ثبت شده در اسناد ارائه كنند. از اين طريق است كه ما سعي ميكنيم بهمنظور آگاه كردن ديگران از طريق تدارك اطلاعات بالقوه، اجزا و وجوهي از دانش خود را به ديگران منتقل سازيم. در بستر علوم كتابداري و اطلاعرساني، سازماندهي دانش (كه اغلب سازماندهي اطلاعات ناميده ميشود) عبارت است از سازماندهي پيامهايي كه به شكل سند درآمدهاند و دانش يا اطلاعات در آنها ارائه شده است. سازماندهي دانش در داخل ذهن يا مغز، محور توجه اصلي روانشناسيشناختي و علومشناختي است.
اين مقاله به رويههاي اصلي سازماندهي دانش در كتابداري و اطلاعرساني شامل نمايهسازي، فهرستنويسي، و ردهبندي كه كنترل واژگان و توصيف سند و محتوا را دربر ميگيرند و نيز به شيوههاي انجام اين اعمال شامل شيوههاي خودكار و شيوههاي ذهني ميپردازد. سپس توجه خود را به محصولات سازماندهي دانش يعني فهرستها، نمايهها، و پايگاههاي اطلاعاتي معطوف ميكند و به بررسي ويژگيهاي اصلي آنها ميپردازد كه عبارتند از: دامنه و حوزه، رسانه پايگاههاي اطلاعاتي، سندها، مبناي تحليل، جامعيت نمايهسازي، روش نمايهسازي، نحو در نمايه و جستوجو، اخصگرايي واژگان، مديريت واژگان، جانشين سند، نمايش سند، و نمايش نمايه.
نقش سازماندهي دانش در كتابداري و اطلاعرساني.
اگر كاركرد اصلي كتابداري، تدارك اطلاعات برحسب تقاضا يا بر اساس پيش بيني تقاضا و بهمنظور بر آوردن نياز باشد، و اگر مطالعه بازيابي اطلاعات هم حيطه اصلي اطلاعرساني باشد، پس دغدغه اصلي دو حوزه كتابداري و اطلاعرساني، و سازماندهي دانش بهمنظور تسهيل بازيابي و دسترسي به اطلاعات خواهد بود. سازماندهي دانش خدمت بنيادين كتابداري و اطلاعرساني به جامعه است و تاريخ آن به قدمت تاريخ نگارش و ظهور نخستين سندهاست.
نمايهسازي، فهرستنويسي، و ردهبندي.
نمايهسازي، فهرستنويسي، و ردهبندي سه شيوه براي سازماندهي دانش هستند كه اغلب با هم اشتباه گرفته ميشوند. نمايهسازي شامل شيوههاي تدارك دسترسي به مجموعه اسناد، اسناد منفرد، و بخشهاي اسناد، بدون توجه به محل نگهداري آنهاست. فهرستنويسي، نمايهسازي مدارك يك مجموعه خاص است. ردهبندي عبارت است از تنظيم و آرايش شناسهها و مقولههاي نمايه يا فهرست، برحسب ارتباط ميان آنها، بر خلاف آرايش الفبايي يا عددي مبتني برحروف و علائم واژههاي شناسههاست. مقولههاي ردهبندي را ميتوان برحسب روابط سلسله مراتبي عام ــ خاص يا كل ــ جزء؛ روابط زماني؛ روابط مربوط به عمل، مُجري عمل و يا هدف عمل؛ روابط ميان رشتههاي علمي؛ اهداف و روشهاي مطالعه؛ و ديگر روابط مشابه مرتب كرد.
از آنجا كه فهرستنويسي و ردهبندي به نمايهسازي وابستهاند و در حقيقت معرف مصاديق نمايهسازي هستند، پس نمايهسازي روش بنيادين سازماندهي دانش محسوب ميشود. از اينرو، اين مقاله به انواع و ويژگيهاي نمايه و نمايهسازي توجه بيشتري معطوف خواهد داشت.
توصيف سند.
نمايهسازي هميشه مستلزم توصيف سند، اسناد يا مجموعه اسنادي است كه حاوي پيامها هستند، مگر اينكه سند يا مجموعه اسناد، همانند نمايه انتهاي كتاب، خود پيدا باشد[2] . توصيف سند معمولا مستلزم ذكر نام پديدآورنده پيام و متن آن؛ نام اطلاق شده به متن، نسخه متن؛ نام ناشر و توزيعكننده و يا سازنده سند؛ اندازه، شكل، تركيببندي، و رسانه سند؛ و ديگر ويژگيهاي مشابه قابل ذكر است.
متون راهنما و دستورالعملهاي بسيار زيادي درباره توصيف اسناد وجود دارد كه بهويژه در قوانين فهرستنويسي مثل قوانين فهرستنويسي انگلو امريكن، و در راهنماهاي كتابنامهنويسي تجلي يافتهاند(3). بهزعم وليس كه او نيز بهنوبه خود متكي بر اثر ويلسون است، هيچ مشكل نظري عمدهاي در توصيف اسناد وجود ندارد (41: 41-50؛42). ميدانيم كه چگونه اين كار را انجام دهيم و راهنماهاي كافي براي صحيح انجام دادن آن را در اختيار داريم، اما اين بدان معنا نيست كه توصيف اسناد كار سادهاي است، چرا كه اسناد اشكال، اندازهها، رسانهها، تركيببنديها، ناشران، و توليدكنندگان متنوع دارند و در عين حال استانداردها براي اين موارد اندك است.
با ورود مدارك الكترونيكي و اينترنت، تعريف و توصيف مدارك دچار اختلال شده و اين امر سزاوار توجه جدي جامعه كتابداري و اطلاعرساني است.
سرشناسه.
يكي از اصطلاحات در فهرستنويسي كتابخانه كه بسيار غلطانداز است و بسيار بد تعبير شده، واژه “شناسه اصلي” يا “سرشناسه” است. اين كژ فهمي ريشه در همبستگي پيشين اين اصطلاح با فهرستهاي چاپي دارد كه در آنها يك شناسه اصلي كامل به همراه چندين شناسه ثانوي مختصر وجود داشت كه به شناسه كامل ارجاع ميدادند. اطلاعات كتابشناختي كامل زير سرشناسه اصلي قرار ميگرفت.
اما هدف اساسي و هميشگي سرشناسه اصلي عرضه كامل اطلاعات نبوده است. فهرستهاي برگهاي كتابخانه از نيمه دوم قرن نوزدهم، ذيل همه شناسهها، اطلاعات كتابشناختي ارائه دادهاند.
هدف سرشناسه تهيه عنوان متحدالشكل استاندارد (عنوان قراردادي) و توصيف معيني از يك پيام است، بهطوري كه آن را از گونهها و انواع تجسمات ديگر آن پيام متمايز كند. هدف اين توصيف آن است كه به ما اجازه دهد تمامي صورتهاي تجلي يك پيام واحد را، صرفنظر از عناوين متفاوتي كه ممكن است به آن اطلاق شده باشد، در كنار هم گردآوريم. نمايشنامههاي شكسپير، قطع نظر از اسامي آنها در زبانهاي مختلف، در زبان انگليسي نيز تحت عناوين مختلف ظاهر ميشوند. اين تجليات مختلف از يك پيام واحد در نمايه يا فهرست پراكنده ميشوند، مگر اينكه سرشناسه اصلي از خود پيام يك توصيف واحد ارائه كند. كساني كه معتقدند در محيط الكترونيك نيازي به سرشناسه اصلي نيست، در حقيقت يا به كاركرد سرشناسه واقف نيستند و يا اعتقادي به اين ندارند كه قابليت گردآوردن همه صورتهاي تجلي يك پيام واحد در كنار هم (كه هدف سنتي فهرستهاي كتابخانهاي است) هنوز هم ارزشمند است.
توصيف محتوا.
توصيف محتوا، مفهوم، هدف، و ويژگيهاي پيام كه بازنمودكنندگان دانش موجود در اسناد هستند، بسيار مشكلتر از توصيف خود سند است. زماني كه مدارك حاضر از قبل شناخته شده نباشند، نوعي نمايهسازي موضوعي، فهرستنويسي موضوعي، يا ردهبندي براي سازماندهي پيامهاي درون آن و دسترسپذير كردن آنها لازم است. برخلاف توصيف ظاهري، در مورد چگونگي توصيف محتوا در ميان بخش اعظم جامعه كتابداري و اطلاعرساني هيچ اجماعي وجود ندارد و بسياري از روشها در اين زمينه با هم رقابت كرده يا يكديگر را كامل ميكنند. اين مسئله، حوزه اصلي تحقيق در علم اطلاعرساني است و اغلب بهعنوان “بازيابي اطلاعات” به آن اشاره ميشود. باقيمانده اين مقاله نيز بيشتر به توصيف محتوا ميپردازد.
كنترل واژگان.
پس از اينكه اسناد و محتواي آنها توصيف شد، اين توصيفها بايد در قالب واژههايي بيان شوند كه با واژههاي پرسش كاوشگر منطبق باشد. اين امر مستلزم نوعي كنترل يا مديريت واژگان است. در رويكرد سنتي اين كار مستلزم بهكارگيري مجموعه محدودي از واژهها همراه با تهيه موردي ارجاعات متقابل از واژههاي جانشين بوده است. اين شيوه براي همه وجوه نمايهسازي از جمله اسامي نويسنده و افراد ديگر (بلر، اريك، نگاه كنيد ارول، جورج)، عناوين پيامها (تاريخ مصيبت هملت، شاهزاده دانماركي، نگاه كنيد به هملت)، نام موضوعات (انفورماتيك نگاه كنيد به اطلاعرساني)، و ويژگيهايي همانند سطح فكري (ادبيات نوجوانان نگاه كنيد به ادبيات كودكان) بهكار رفته است.
اسامي اشخاص و پيامها طبق روال سنتي بر اساس قواعد دقيق، نظير قوانين فهرستنويسي انگلو امريكن استاندارد ميشوند(3). موضوعات و جنبههاي خاص نيز طي قرن گذشته با ايجاد فهرستهاي مفصل سرعنوانهاي مصوب، مثل >سرعنوانهاي موضوعي كتابخانه كنگره< استاندارد شدهاند (28). در دهههاي آخر قرن بيستم، بهمنظور استانداردسازي اصطلاحات نمايهسازي در بسياري از رشتهها و حوزههاي موضوعي، اصطلاحنامههاي بسياري براي بازيابي اطلاعات با تأكيد بر واژههاي تك مفهومي، بهجاي سرعنوانهاي موضوعي مركب، ايجاد شدهاند.
پژوهشها در حوزههاي روانشناسي و اطلاعرساني بارها نشان داده است كه استفاده انسان از زبان براي جستوجوي اطلاعات بسيار تغييرپذير است 8: 116-132). اين مسئله هم در مورد جستوجوگر و هم در مورد نمايهساز صدق ميكند (35: 161-216). پژوهشهاي متعدد نشان داده كه نمايهسازها و جستوجوگران بر سر 25 درصد از واژهها توافق دارند. بخش اعظم اين تغييرپذيري به خاطر اختلاف در انتخاب واژهها و بقيه به خاطر اختلاف در درك يا مفهومسازي موضوعات يا ويژگيهاست (20: 423-430). فورناس و همكارانش معتقدند يك نظام خوب بازيابي اطلاعات براي سازگاري با 80 درصد گزارههايي كه كاربران براي كاوش ارائه ميكنند، نيازمند تدارك 15 شيوه براي بيان يك موضوع يا ويژگي است (16: 964-971).
با استفاده روزافزون از فنون نمايهسازي خودكار و افزايش نياز به كاوش در پايگاههاي اطلاعاتي متعدد كه حتي واژگان كنترل شده آنها نيز ميتواند بينهايت گوناگون باشد، دانشمندان علم اطلاعرساني دست به آزمايش استفاده از اصطلاحنامههاي كاوش[3] (در مقابل اصطلاحنامههاي نمايهسازي) زدهاند. اصطلاحنامههاي كاوش حاوي صورت اصطلاحات مرجّح، كه نمايهسازها بايد از آنها استفاده كنند، نيستند، بلكه ميكوشند تا كل واژگان يك حوزه موضوعي را ترسيم كنند و تمامي واژگان گوناگون در مورد مفاهيم واحد و واژههاي مرتبط عام، خاص، و همبسته را به هم پيوند دهند. هدف آنها بهجاي محدود يا كنترل كردن واژگان نمايهسازي، تسهيل فرايند كاوش بدون توجه به واژگان نمايهاي است.
شيوههاي خودكار و ذهني.
براي توصيف محتوا، ويژگيها، و كاربردهاي احتمالي پيامها بهمنظور بازيابي اطلاعات دو رهيافت بنيادين وجود دارد: تحليل ذهني توسط انسان، و الگوريتم رايانهاي[4] . نمايهسازي توسط انسان را معمولا به اشتباه نمايهسازي دستي مينامند، اما اين نمايهسازي توسط ذهن انجام ميشود نه دست. اين دو شيوه تحليل پيام، بهمنظور تقويت يكديگر و رفع متقابل كاستيها هر روز بيش از پيش با هم تركيب ميشوند.
1. نمايهسازي خودكار. نمايهسازي خودكار، تقريبآ بهصورت انحصاري براي تحليل پيامهاي متون گفتاري بهكار رفته است (7: 29-38؛ 34: 97-108). تحقيق براي بهكارگيري فنون خودكار در مورد تصاوير نيز مدتي قبل آغاز شده است (14). به استفاده از فنون خودكار براي توصيف سند مثلا در فهرستنويسي توصيفي كه نقطه مقابل توصيف محتوا، جنبهها، يا كاربردهاي پيام است نيز توجه ناچيزي شده است (23: 263؛ 31: 83-95؛ 40: 67-80).
فنون خودكار معمولا به تحليل آماري بسامد لغات در متن متكي هستند. بيشتر مواقع براي جدا كردن ريشه لغات روشهايي به اين شيوه ابتدايي اضافه ميشود. گاه از تجزيه و تحليل نحوي نيز براي تشخيص عبارتهايي كه بايد بهصورت يك واحد با آنها برخورد شود، استفاده ميشود. از طريق تطبيق لغات يا عبارات با اصطلاحنامههاي جامع بهمنظور تثبيت اصطلاحات متحدالشكل و پيوند واژههاي مرتبط، ميتوان وجوه معناشناختي را نيز به نمايهسازي خودكار افزود.
از همايندي[5] يا با هم آمدن لغات، اصطلاحات، عبارات، و استنادهاي كتابشناختي ميتوان براي يافتن اسناد مرتبط بهره برد. در واژهنامه تعاملي همبسته[6] ، هر اصطلاح را برحسب ميزان همبستگي آن با ديگر اصطلاحهاي متن بازيابي شده يااصطلاحهايي كه توسط نمايهساز به آن منتسب شده، مرتبهبندي ميكنند (12: 105-109). اين كار براي آن صورت ميگيرد كه از لحاظ همايندي اصطلاحهايي كه بيشترين ربط را به يكديگر دارند، اول عرضه شوند. بهطور مثال طبق اين رويه در حوزه پزشكي، واژههايي مثل “پستولدي”، “بارداري” و “جنين” بهعنوان مرتبطترين واژهها با واژههاي كاوش “پيشتولدي” و “مسموميت حاملگي” ارائه ميشوند.
همايندي استنادهاي كتابشناختي، پايه و اساس نمايههاي استنادي است كه به كاوشگران كمك ميكند تا به رديابي نويسندگان و اسنادي بپردازند كه به آثار پيشين استناد كردهاند. از اشتراك مآخذ[7] ميتوان براي دستهبندي گروههاي اسناد با استنادهاي يكسان استفاده كرد (22: 10-25). از اشتراك متن[8] براي شناسايي دستههايي از اسناد جديد كه همراه با هم مورد استناد قرار ميگيرند، استفاده ميشود. اين شيوه ميتواند براي شناسايي الگوهاي پژوهشي در حال ظهور بهكار آيد(36: 265- 269).
تحليل معنايي نهفته[9] ، نمونهاي از شيوههاي پيشرفته نمايهسازي خودكار است. در اين شيوه پيامها توصيف ميشوند، اما نه به اتكاي وجود واژههاي منفرد كه حتي در بحث از موضوع واحد ميتوانند بسيار متفاوت باشند؛ بلكه برمبناي دستههاي واژههايي كه از طريق تحليل آماري بسامد آنها در متون متعدد، بهعنوان واژههاي دقيقآ مرتبط شناخته شدهاند. تحليل معنايي نهفته سعي دارد تا با استفاده از اين خوشههاي واژهها كه نسبت به واژههاي منفرد ثبات بيشتري دارند، بر دشواري ناشي از بهكارگرفتن واژههاي گوناگون در متون هم موضوع فائق آيد (10: 391-407).
برخي از پيشرفتهترين شيوههاي بازنمايشي و سازماندهي دانش را ميتوان در نظامهاي خبره[10] جستوجو كرد. اهميت نظامهاي خبره ــ كه بر پژوهش در حوزههاي هوش مصنوعي و پردازش زبان طبيعي مبتني هستند ــ براي پشتيباني فرايند تصميمگيري اطلاعات مديريتي، تشخيص پزشكي، نظامهاي اطلاعات جغرافيايي، فضايي، و نظاير آن روز به روز بيشتر ميشود (17: 639-717). برخلاف نظامهاي بازيابي اطلاعات، كه به بازيابي متون موجود ميپردازند، نظامهاي خبره به خلق متون جديد با استفاده از شيوههايي ميپردازند كه استنتاج را ميسر و كنترل بازنمودهاي دانش بهمنظور ارائه پاسخ به مسائل را ممكن ميسازند. براي انجام چنين عملياتي، دانش تخصصي در قالب قواعد، چارچوبها، ردهها، سلسله مراتبها، خصيصهها، گزارهها، حدود و رويهها، يقينيات، فواصل احتمالي، و متغيرهاي مبهم ارائه ميشود (18: 27-39).
2. نمايهسازي ذهني توسط انسان. توصيف فرايند نمايهسازي توسط انسان بسيار مشكل است. روالي كه انسان براي درك و شناسايي موضوعات، ويژگيهاي مهم و معنيدار، و كاربردهاي احتمالي متون نوشتاري، تصاوير يا ديگر انواع پيامها بهكار ميگيرد؛ ريشه در فرايندهاي ادراكي ذهن و مغز دارند. اين فرايندها هنوز به خوبي فهم نشدهاند و مركز توجه حوزههايي نظير روانشناسيشناختي، علومشناختي، و هوش مصنوعي هستند. ميدانيم كه نمايهسازي توسط انسان حداقل دو مرحله عمده دارد: 1) شناسايي موضوع، جنبهها يا كاربردها؛ و 2) توصيف اين موضوعات در قالب واژههاي مناسب براي بازيابي. همچنين ميدانيم كه نمايهسازها، خواه متخصص و با تجربه و خواه مبتدي و بيتجربه، نمايهسازي را با شيوههاي بسيار گوناگون اجرا ميكنند (25). استفاده از واژگان كنترل شده تنها كمي از اين تنوع و تغييرپذيري ميكاهد. رابرت فوگمن مدعي است كه با استفاده روزافزون از راهنماها و قوانين سفت و سخت براي تعيين موضوعات و ويژگيها و كاربردها، و نيز براي تعيين و تخصيص واژهها، ميتوان چندگانگي نمايهسازي را تا حد زيادي كاهش داد، اما اين ادعا هنوز در عمل ثابت نشده است (15).
فنون نمايهسازي به كمك رايانه.
نظامهاي سازماندهي دانش روز به روز بيشتر از مزيت هر دو شيوه نمايهسازي خودكار و نمايهسازي توسط انسان بهره ميبرند. گرايش نمايهسازي خودكار به سمت جامعيت[11] بيشتر و برخورداري از اصطلاحات اخصتر است (جامعيت و اخصيت بزودي تشريح ميشود)، اما گرايش نمايهسازي توسط انسان به گزينشيتر بودن و استفاده بيشتر از اصطلاحات عامتر و اغلب يكدستتر است. زماني كه موضوع يا ويژگي يا كاربرد مورد نظر به صراحت در متن مورد بحث قرار نگيرد، شيوه نمايهسازي توسط انسان ميتواند در شناسايي پيامهاي مورد توجه مراجعان، موفقتر عمل كند.
اما حتي زماني كه از نمايهسازي خودكار اجتناب ميشود، فنون رايانهاي بهمنظور تسهيل نمايهسازي توسط انسان بيشتر و بيشتر مورد استفاده قرار ميگيرند.
نرمافزارهاي نمايهسازي.
نرمافزارهاي نمايهسازي بهصورت گسترده در نمايهسازي توسط انسان بهكار ميروند، اما نه براي تحليل متن، بلكه براي تهيه انواع ابزارها و فنون كه به شخص نمايهساز در اجراي وظايف عادي كمك ميكنند؛ نظير تركيببندي و مرتب كردن مداخل، ايجاد و اصلاح ارجاعات متقابل، و كپي گرفتن از شناسههايي كه قبلا تعيين شدهاند (13). اين برنامهها مستقل و خودكفا هستند و نبايد آنها را با برنامههاي موسوم به “واحدهاي نمايهسازي”[12] كه بهعنوان يك جزء در بيشتر برنامههاي واژهپرداز وجود دارند، يكي دانست. واحدهاي نمايهسازي كه معمولا برنامههاي نمايهسازي “تعبيه شده”[13] ناميده ميشوند، به نويسنده امكان ميدهند كه واژهها را براي نمايهسازي از درون متن برگزينند، يا واژهها و عبارات ديگري را وارد كنند، بعد ميتوان اين واژهها و عبارات را در يك نمايه گردآوري كرد. تاكنون هنگام نياز به ويرايش شناسهها، بهويژه براي افزودن شناسههاي فرعي متكي بر متن، استفاده از اين برنامهها مشكل بوده است (32).
الگوريتمهاي نمايهسازي رشتهاي[14] .
يكي از قديميترين كاربردهاي رايانه براي نمايهسازي، خلق الگوريتمهايي براي ايجاد مدخلهاي مركب با استفاده از يك گروه يا يك رشته از واژههاي همبسته با متن بود كه هر يك از آنها با يك واژه متفاوت آغاز ميشدند (9). نظام نمايهسازي پرسي[15] يا نظام نمايهسازي با حفظ بافت، كه زير نظر درك آوستين* براي كتابشناسي ملي بريتانيا ايجاد شد، نمونهاي قديمي و بسيار تأثيرگذار از اين نوع نمايهسازي است (5). از الگوريتمهاي رشتهاي براي خلق قديميترين نمايههاي خودكار يعني كوويك[16] (كليد واژه درون متن)،كووُك[17] (كليد واژه خارج از متن)، و كواك[18] (كليد واژه در كنار متن) استفاده شد. توضيحات بيشتر در مورد اين سه نوع نمايه ذيل مبحث “نحو” ارائه خواهد شد.
نظامهاي الهامگر مبتني بر چارچوب[19] .
يكي از تلاشهاي پيشرفتهتر كه بهمنظور تدارك كمكهاي رايانهاي براي بهبود نمايهسازي توسط انسان صورت گرفته، پروژه مدايندكس[20] كتابخانه ملي پزشكي امريكاست (19: 45-54).
در اين پروژه چارچوبي براي نمايهسازي فراهم ميشود كه در قالب آن دستههاي واژههاي مرتبط ارائه و پيشنهاد ميشوند. از آنجا كه واژهها اغلب درون خوشهها تعيين و منتسب ميشوند، انتساب يك واژه ميتواند الهامگر و پيشنهاددهنده واژههاي مرتبط ديگر باشد كه بارها به همراه واژه اول بهكار رفته است. اميد است كه اينگونه نظامها به انجام نمايهسازيِ دقيقتر و همگونتر كمك كند.
فهرستها، نمايهها، و پايگاههاي اطلاعاتي.
محصول سازماندهي دانش بهصورت فهرستها، نمايهها، كتابشناسيها، دايرهالمعارفها، دستنامهها، و حتي نمايههاي انتهاي كتاب براي رسالههاي تكنگاشت و هر آنچه كه بتوان آن را با عنوان “پايگاه بازيابي اطلاعات” گنجاند، ارائه ميشود. گاهي اينها را پايگاههاي اطلاعات متني[21] يا پايگاه متون[22] مينامند. اما در اين مورد، كلمه متن حاكي از هر نوع مجموعه سازمان يافته از علائم است كه براي انتقال يك پيام (بصري، صوتي، كلامي) از آن استفاده ميشود و نه صرفآ متون نوشتاري. همچنين اين تصور درباره پايگاه بازيابي اطلاعات به هيچ رسانه خاصي محدود نميشود و همه نوع پايگاههاي اطلاعاتي چاپي و الكترونيكي را دربر ميگيرد.
پايگاههاي بازيابي اطلاعات، از جمله اجزا و رويههاي دسترسپذير كردن آنها براي كاربران، نظامهايي هستند كه محصول سازماندهي دانش از طريق آنها به افرادي كه خواهان جستوجوي اسناد يا اطلاعات هستند، ارائه ميشود.
درست همانگونه كه ابزارها و ماشينها را ميتوان صورت توسعه يافته عضلات انسان تلقي كرد كه ما را قادر ميسازند با توان بسيار بيشتر بهكارهاي خويش بپردازيم، پايگاههاي بازيابي اطلاعات را نيز ميتوان صورت توسعه يافته ذهن، بهويژه حافظه و فنون ذهني، براي بازيابي اطلاعات تلقي كرد (2: 287-323). پس، فهرستها، نمايهها، و پايگاههاي اطلاعاتي، ابزارهايي مصنوعي هستند كه ما آنها را براي افزايش قدرت سازماندهي ذهن خلق كردهايم.
بخش باقيمانده اين مقاله به بحث درباره ويژگي اين پايگاههاي بازيابي اطلاعات ميپردازد. كاربران با تجربه و خبره ميخواهند بدانند هر يك از ويژگيهاي زير در مورد اين پايگاهها چگونه بهكار ميرود. پايگاههاي اطلاعاتي بايد اين اطلاعات را در دسترس كاربران علاقهمند قرار دهند.
دامنه[23] و قلمرو[24] .
هزاران پايگاه بازيابي اطلاعات براي كاوش در دسترس قرار دارند. گام اول در هر كاوش مؤثر، گزينش پايگاه يا پايگاههاي اطلاعاتي مناسب است. توصيف صريح و موجز دامنه و قلمرو پايگاه ميتواند به اين فرايند گزينش ابتدايي كمك كند.
دامنه، به ويژگيهاي اسنادي مربوط ميشود كه تحتپوشش يك پايگاه اطلاعاتي قرار ميگيرند. قلمرو، به خصوصيات منابع اطلاعات درباره اين اسناد اشاره دارد؛ از جمله محدوده جغرافيايي تحت پوششي كه اين اسناد به آنجا تعلق دارند (6: 7-26).
دامنه موضوعي.
ارائه تعريف درست درباره دامنه موضوعي براي استفادهكننده، مشخص ميكند چه مقولههاي موضوعي، با چه ويژگيها و كاربردهايي نمايه شدهاند و تلويحآ مشخص ميكند كه پايگاه مورد نظر براي چه سؤالات و كاوشهايي مناسب است. براي بيان دامنه موضوعي، تنها ذكر نام حوزههاي موضوعي كلي نظير پزشكي كافي نيست. چنين توصيف گلوگشادي نميتواند به كاربر بالقوه[25] پاسخ دهد كه آيا پايگاه اطلاعاتي ميتواند پاسخگوي سؤالات وي درباره درمانها يا داروها، انواع كاركنان حوزه پزشكي، پزشكان خاص، انواع مؤسسات پزشكي و يا اقتصاد بيمه بهداشتي باشد يا خير. بيان دقيق دامنه موضوعي، شامل فهرستي از مقولههاي موضوعي، ويژگيها، و كاربردهاي نمايه است. همين فهرست ميتواند بهعنوان راهنما، نمايهسازان را براي تعيين موضوعات بالقوه مهم براي كاربران، كمك كند. چنين فهرستهايي همچنين ميتوانند به تبليغ و ترويج نمايهسازي بيانجامد كه بهجاي توجه صرف به محتواي سند ميكوشد پاسخگوي علايق خاص كاربران نيز باشد. سورگل اينگونه نمايهسازي را نقطه مقابل نمايهسازي سند ـ محور[26] يا هويت ـ محور[27] ميشمارد و به آن نمايهسازي تقاضا ـ محور[28] ميگويد. وي مثالي از يك سند در موضوع “درصد فرزندان خانوادههاي كارگر كه به دانشگاه راه يافتهاند” ارائه ميكند. در نمايهسازي تقاضا – محور ميتوان از اصطلاحاتي نظير “حركت اجتماعي بين نسلي” نيز براي وصف موضوع اين سند استفاده كرد، حتي اگر اين موضوع بهصورت مستقيم در آن مورد بحث قرار نگرفته باشد (37).
نمونههايي از مقولههاي دامنه موضوعي عبارتند از: پديدههاي عيني مثل اشخاص (افراد يا گروهها)، نهادها، مصنوعات، و اشياء طبيعي؛ پديدههاي انتزاعي، مثل نظامهاي اعتقادي، رشتهها، نظريهها، فرضيهها؛ پديدههاي خيالي، مثل شخصيتهاي داستاني و جانوران افسانهاي؛ ويژگيها و خصيصهها؛ مواد خام يا عناصر سازنده؛ اعمال؛ فرايندها؛ رهيافتهاي روششناختي؛ وقايع و شرايط؛ مكانها يا محيطها؛ زمانها و دورههاي تاريخي؛ و قالبها و انواع دادهها يا متنها. فهرست دامنه موضوعي در مورد حوزههاي محدودتر بايد اخص باشد، بهطور مثال در مورد ادبيات بايد مقولههاي موضوعي و ويژگيهايي را در نمايه گنجاند كه عبارتند از: افراد (از جمله نويسندگان و منتقدان)، آثار ادبي، گروههاي انساني، نهضتها، زبانها، مكانها، گونههاي ادبي، رسانههاي نمايشي، ويژگيهاي سبكي و ساختاري، مضامين، منابع، تأثيرات، فرايندها، رهيافتهاي روششناختي، نظريهها، و ابزارها (30).
دامنه سندي[29] .
در حالي كه عرصه موضوعي به تعريف موضوعات، وجوه، و كاربردهاي اسنادي كه بايد نمايه شوند ميپردازد؛ دامنه سندي، ويژگيهاي اسنادي را تعيين ميكند كه در پايگاه اطلاعاتي پذيرفته شدهاند. اين ويژگيها بسته به نوع رسانه متفاوت خواهند بود. در مورد اسناد چاپي كاغذي، اين ويژگيها شامل قطع، نوع، دوره انتشار (تكنگاشت و انواع پيايندها)، سطح يا مخاطبان، نظام زباني يا ساير نظامهاي متني، محل نشر، تاريخ نشر يا تاريخ اضافه شدن به مجموعه، ميشود.
ميتوان دامنه سندي يك پايگاه اطلاعاتي را به راحتي با تهيه صورت اسامي اسناد نمايه شده توصيف كرد. در مورد پايگاه مقالات نشريات اين كار را ميتوان با تهيه فهرستي از نشريات نمايه شده انجام داد. نمايههاي انتهاي كتب نيز در اين مقوله جاي ميگيرند، چرا كه دامنه سندي آنها مشهود است.
ديگر معيارهاي سندي شامل اموري نظير كيفيت پايگاه يا مناسب بودن آن براي مراجعان خاص يا اهداف ويژه ميشود. اين ملاحظات را بايد تا آنجا كه ممكن است، برشمرد.
قلمرو.
قلمرو، اشاره به محدودهاي دارد كه دادههاي مربوط به اسنادِ نمايه شده در پايگاه اطلاعاتي در آن گردآوري ميشود. نخستين سؤال در اين مورد آن است كه آيا دادههاي پايگاه اطلاعاتي از منابع رديف اول گرد آمده است؟ برخلاف منابع رديف دوم كه دادههاي مربوط به اسناد در آنها از منابع ديگري نظير نمايهنامهها و چكيدهنامهها، فهرستهاي كتابخانهاي يا آگهيهاي ناشران گردآوري ميشوند، در پايگاههاي ديگر، اين دادهها، بر پايه بررسي و تجزيه و تحليل مستقيم توصيف و نمايه ميشوند. دومين وجه قلمرو، محدوده جغرافيايي تحت پوشش پايگاه است كه اسناد در محدوده دامنه سندي و موضوعي معيني از آن گردآوري ميشوند. يك پايگاه اطلاعاتي كه تنها به اسناد موجود در يك مجموعه خاص محدود ميشود، بسيار متفاوت با پايگاهي است كه اسناد موجود در پژوهشهاي جامع در سراسر جهان را تحت پوشش دارد.
فهرست، مشخصآ نوعي پايگاه اطلاعاتي است كه قلمرو آن به يك مجموعه واحد يا در مورد فهرستگان مشترك به چند مجموعه محدود ميشود.
ممكن است به نظر برسد كه مسئله دامنه موضوعي و سندي در مورد فهرستها صدق نميكند، اما اين تصور نادرست است چرا كه بهندرت ميتوان فهرستي يافت كه تمامي اسناد يك مجموعه را تحت پوشش قرار دهد. بيشتر مواقع، گروههاي مختلفي از اسناد مثل اسناد دولتي يا گزارشهاي سالانه تنالگانها (سازمانها و شركتها) و جزوههاي كوچك از فهرستها حذف ميشوند. علاوه براين، فهرستها ضرورتآ هر ويژگي يا موضوعي را نمايه نميكنند. از اينرو، هر چقدر قلمرو نمايهسازي موضوعي را با صراحت بيشتري مشخص كنيم، كاربران راحتتر ميتوانند تشخيص دهند كه آيا فهرست، مناسب جستوجوي آنان هست يا خير.
رسانه پايگاه اطلاعاتي.
رسانه پايگاه اطلاعاتي گزينههاي بسياري را مجاز يا ممكن ميكند. رسانههاي اصلي عبارتند از: چاپ كاغذي مثل برگهدانها، و الكترونيكي مثل پايگاههاي اطلاعاتي پيوسته، لوحهاي فشرده و مجموعه رو به رشد چندرسانهايهاي نوري، ديجيتالي، ويدئويي، و نظاير آنها. ريزفيلمها در گذشته از رسانههاي مهم پايگاههاي بازيابي اطلاعات بودند، اما امروزه رسانههاي الكترونيكي تا حد زيادي جانشين آنها شدهاند.
پايگاههاي اطلاعاتي الكترونيكي.
رسانههاي الكترونيكي امكان كاوش الكترونيكي ركوردهاي پايگاه اطلاعاتي را بدون ديدن مدخلهاي نمايه فراهم ميسازند. در اين رسانهها ميتوان واژهها را در برنامه كاوش وارد كرد، تا بعدآ آن دسته از ركوردهاي اسناد، كه حاوي همه يا برخي واژههاي كاوش هستند، بازيابي و فهرست شوند. نمايههايي كه بهجاي مشاهده، بهصورت الكترونيكي كاوش ميشوند، نمايههاي غيرنمايشي[30] ناميده ميشوند (4). البته در رسانههاي الكترونيكي هم ميتوان نمايهها را براي مشاهده و تورّق نمايش داد.
مزاياي اصلي پايگاههاي اطلاعاتي الكترونيكي عبارتند از: قابليت روزآمدسازي سريعتر (بهويژه در مورد پايگاههاي اطلاعاتي پيوسته)، كاهش حجم عظيمِ آن به لحاظ فيزيكي و هزينه رو به افزايش توليد آن، افزايش قابل توجه گزينهها، و انعطافپذيري كاوش. در حالي كه در پايگاههاي اطلاعاتي چاپي، مدخلهاي نمايه ثابت است و شخص تنها ميتواند شناسههاي از قبل ايجاد شده را در چارچوب و نظمي كه چاپ شدهاند، كاوش كند، در نمايههاي الكترونيكي با بهرهگيري از فنون كاوش الكترونيكي امكان جستوجوي هر واژه، يا هر رشته از حروف يا چند كلمه با آرايشهاي متفاوت وجود دارد. از اينرو، واحدهاي جستوجوي ديگر شناسههاي كامل، از پيش ايجاد شده و مرتب شده نيستند، بلكه كلمات منفرد يا بخشهايي از كلمات هستند كه ميتوان آنها را با هر ترتيبي با هم تركيب كرد. علاوه براين، بهجاي اينكه تنها واژهها يا شناسههايي را كه در يك نمايه قابل جستوجو جاي داده شدهاند كاوش كنيم، ميتوانيم كل ركوردها و گاه كل متون را مورد كاوش قرار دهيم.
پايگاههاي اطلاعاتي چاپي.
در پايگاههاي اطلاعاتي كه بهصورت رسانههاي چاپي ارائه ميشوند، نمايهها بايد نمايش داده شوند، چرا كه تنها از طريق وارسي بصري ترتيب شناسههاي نمايه است كه كاربر ميتواند به نمايه دست يابد.
مزاياي اصلي پايگاههاي اطلاعاتي چاپي عبارتند از: قابليت حمل و جابهجايي (با اين فرض كه بيش از اندازه بزرگ و حجيم نباشند)، قابليت جستوجو بدون استفاده از واسطه الكترونيكي، قابليت تفكيك بصري و وضوح بيشتر در چاپ، و امكان طرحهاي بيشتر براي آرايش مدخلها. بهعلاوه، درك ساختار و آرايش نمايههاي چاپي از طريق نگاه كردن به آن براي كاربران آسانتر است، در حالي كه اغلب درك ساختار و محتواي نمايههاي الكترونيكي، بهويژه آنهايي كه بدون رؤيت و از طريق الگوريتمهاي الكترونيكي كاوش ميشوند، مشكل است. حتي زماني هم كه نمايهها در رسانههاي الكترونيكي به معرض نمايش درميآيند، دامنه نمايش بهندرت به اندازه دامنه نمايش در پايگاههاي اطلاعاتي چاپي خوب طراحي شده، وسيع است.
نمايش در رسانههاي الكترونيكي هر روز ماهرانهتر ميشود و مزاياي آن از جهات مختلف، بهويژه از لحاظ صرفه اقتصادي، بر مزيتهاي رسانههاي چاپي بيشتر است. با اين همه، احتمالا نياز به پايگاههاي اطلاعاتي چاپي خوب طراحي شده نيز هميشه وجود خواهد داشت.
واحدهاي سندي.
حجم واحد سندي كه براي بازيابي در يك پايگاه دادهها سازماندهي ميشود، حجم واحد بازيابي را تعيين ميكند. اين قضيه يكي از معدود قوانين عِلّي در كتابداري و اطلاعرساني است. حجم واحد سندي، متغير اصلي و زمينهساز تمايزاتي است كه گاه (به اشتباه) ميان نظامهاي بازيابي “اطلاعات” و نظامهاي بازيابي “سند” يا نظامهاي بازيابي “كتابشناختي” قائل ميشوند. قضيه اين نيست كه آنچه در نظامهاي بازيابي اطلاعات بازيابي ميشود، پاسخ مستقيم به سؤالات است و آنچه در نظامهاي بازيابي سند يا نظامهاي بازيابي كتابشناختي بازيابي ميشود اسناد كامل يا استنادهاي صورت گرفته به اسناد است؛ بلكه تفاوت حقيقي در اندازه واحدهاي سندي است كه تحليل، توصيف، سازماندهي، و بازيابي ميشوند. در همه موارد آنچه كه بازيابي ميشود، اسناد يا بخشهايي از اسناد هستند، چرا كه پيام هميشه بايد در يك رسانه ارائه شود و اين درست همان چيزي است كه سند نام دارد، يعني پيام ثبت شده در رسانه (4). وجه تمايز ميان پايگاههاي اطلاعاتي تمام متن و مرجع ذيل مبحث “جانشين” تشريح ميشود.
حجم واحدهاي سندي ميتواند از اندازه بسيار كوچك مثل تك گزارهها، تا بسيار بزرگ مثل متن كامل تكنگاشتها، پيايندها، دورههاي كامل نشريات يا حتي مجموعههاي بزرگ و كتابخانهها متغير باشد. آنچه تجزيه و تحليل، توصيف، و سازماندهي ميشود، واحد سندي است كه بازيابي شده يا به آن اشاره خواهد شد.
بهطور سنتي، واحدهاي سندي را در فهرستهاي كتابخانهاي، تمام اسناد؛ و در سرويسهاي نمايهسازي و چكيدهنويسي، تمام تكنگاشتها يا تمام مقالات نشريات تشكيل ميدهند. برخي كتابخانههاي تخصصي و بسياري از خدمات نمايهسازي و چكيدهنويسي، فصلهاي كتاب ــ بهويژه در مورد مجموعه مقالات يا خلاصه مذاكرات كنفرانسها ــ را تجزيه و تحليل، توصيف، و سازماندهي ميكنند. در اينگونه موارد، واحد سندي با دامنه سندي پايگاه اطلاعاتي مطابقت دارد. اما ضرورتآ هيچ ارتباطي ميان انواع اسنادي كه بهمنظور شمول در حوزه سندي تعريف شدهاند و واحد سندي كه بهمنظور تجزيه و تحليل، سازماندهي، و بازيابي مشخص شده است، وجود ندارد. بهطور مثال، مقالات نشريات را ميتوان بهصورت صفحه به صفحه يا بند به بند تجزيه و تحليل كرد و در اين حالت ميتوان كاوشگر را به يك صفحه يا پاراگراف خاص هدايت كرد.
استفاده از واحدهاي كوچكتر براي تحليل، به مرور در پايگاههاي اطلاعاتي تمام متن رايج ميشود؛ چون هيچ كس خواهان آن نيست كه متن كامل يك سند را كاوش كند و سپس به متن كامل يا حتي به يك بخش بزرگ از متن ارجاع داده شود. كاوشهاي تمام متن بايد شخص را مستقيمآ به بخشي هدايت كنند كه مرتبطترين بخش با كاوش است و اين دقيقآ همان چيزي است كه در نظامهاي كارآمدِ بازيابيِ تمام متن روي ميدهد. واحد سندي، هر واحد از متن است و در مورد متون نوشتاري شامل جمله يا پاراگراف ميشود.
نمايههاي انتهاي كتاب بهطور سنتي صفحه را واحد تحليل يا واحد سندي در نظر ميگيرند، طوري كه اين نمايهها با استفاده از شماره صفحه، كاوشگر را به صفحه ارجاع ميدهند. در راهنماي پيشنهادي استاندارد ملي امريكا براي نمايهها و ابزارهاي مرتبط با بازيابي اطلاعات كه توسط سازمان استانداردهاي اطلاعاتي ملي (نيسو)[31] امريكا تدوين شده، آمده است كه چنين نمايههايي بهتر است از واحدهاي طبيعي يا اصلي متن نظير پاراگراف استفاده كنند (4). با توجه به اينكه هر روز كتابهاي بيشتري به هر دو صورت چاپي و الكترونيكي منتشر ميشوند، اين مسئله حائز اهميت ويژهاي است. در اكثر كتابها، صفحه، عنصري از متن نيست، بلكه صرفآ عنصري از رسانه است كه متن در آن ارائه شده است. با انتقال متن كتاب چاپي به رسانه الكترونيكي، صفحات منتقل نميشوند، مگر اينكه بهصورت تصنعي شماره صفحات را به رسانه الكترونيكي تحميل كنيم.
مبناي تحليل[32] .
زماني كه واحد سندي براي يك نظام خاص سازماندهي دانش تعيين و تثبيت شده باشد، مبناي تحليل درون آن واحد نيز بايد تعيين شود. مبناي تحليل، پارهاي از يك واحد سندي است كه بهمنظور گنجاندن در نظام سازماندهي مورد تجزيه و تحليل قرار ميگيرد و بازيابي برمبناي آن صورت خواهد گرفت. مبناي تحليل ميتواند كاملا مختصر باشد. مثل عنوان يك سند يا يك چكيده؛ يا ميتواند همه سند را بهطور كامل دربر گيرد.
اندازه مبناي تحليل بايد با جامعيت نمايهسازي متناسب باشد. اگر قرار باشد تنها تعداد كمي واژه به يك سند منتسب يا از آن استخراج شود، مبناي تحليلِ كوچك، نظير عنوان و / يا چكيده، ميتواند براي بسياري از مقاصد كفايت كند. هر چند اينكه عنوان به تنهايي تا چه حد ميتواند مبناي تحليل مناسبي باشد، بستگي به اين دارد كه چنين عنواني تا چه اندازه چكيده دقيق محتوا، ويژگيها، و كاربردهاي احتمالي متن باشد. همه ما موارد زيادي را ميشناسيم كه عنوان، فاقد اين ويژگي است. اينگونه عناوين را ميتوان با افزودن يك عبارت توضيحي غني ساخت.
نمايهسازي جامعتر به مبناي تحليلِ بزرگتري نياز دارد. در مورد مقالات نشريات، علاوه بر عنوان و چكيده، مقدمه، نتيجه، و يا حتي كل مقاله ميتواند مبنا را تشكيل دهد.
نمايهسازي موضوعي فهرستهاي كتابخانهاي از جامعيت كمتري برخوردار است. اين فهرستها بهصورت خلاصه براي توصيف محتوا يا ويژگيهاي يك كتاب تهيه ميشوند. در اغلب موارد، ضرورتي ندارد كه براي اين سطح از نمايهسازي، به مطالعه يا بررسي همه كتاب بپردازيم و در بيشتر موارد فهرست مندرجات و پاراگرافهاي مقدماتي كفايت ميكند.
جامعيت.
به سطح تفصيلي در توصيف محتوا، معنا، هدف، يا ويژگيهاي يك پيام و متن بهمنظور بازيابي آن، جامعيت نمايهسازي ميگويند. به بيان كمّي، جامعيت، تعداد واژههايي است كه از يك متن استخراج شده يا به آن منتسب ميشود.
نمايهسازي بسيار گزينشي با جامعيت پايين، مبتني بر آستانه اهميت[33] بسيار بالاست كه از قبل بايد تعيين شده باشد. در نتيجه، مداركي كه بر اساس اين نوع نمايهسازي بازيابي ميشوند، احتمالا با يك جستوجو با استفاده از يكي از واژههاي نمايه بسيار مرتبط هستند. چرا كه در اين نمايهسازي تنها موضوعات محوري و ويژگيهاي برجسته نمايه ميشوند. بنابراين، حداقل از لحاظ نظري، نمايهسازي با جامعيت پايين ميتواند به نتايج كاوش بسيار دقيق منجر شود كه بازيابي نامربوط در آن بسيار ناچيز است. از سوي ديگر بسياري از مدارك با موضوعي مطلوب (كه ممكن است براي كسي كه در جستوجوي همه چيز در رابطه با آن موضوع است، مرتبط باشد و بهصورت موضوعي فرعي برخورد كرده باشد) بازيابي نخواهد شد. نتيجه اين امر از دست رفتن فراخواني[34] مطلوب است.
نمايهسازي با جامعيت بالا، آستانه اهميت كمتري را در اختصاص يك واژه اقتضا ميكند. نمايهسازي با جامعيت بالا بهصورت بالقوه منجر به فراخواني بيشتر ميشود. زيرا بيشتر مداركي كه موضوعي خاص در آن بحث شده، بازيابي ميشود. اما فراخواني اسنادي هم كه موضوع مورد نظر را بهصورت حاشيهاي مورد بحث قرار دادهاند نيز بازيابي ميشوند. كاربراني كه تنها خواستار اسنادي هستند كه بهصورت مستقيم به موضوع مورد نظر مربوط ميشوند، ممكن است اسنادي را كه بهصورت حاشيهاي به موضوع پرداختهاند، بيربط بدانند. از اينرو، ممكن است دقت كاوش پايين بيايد.
نمايهسازي خودكار، به سطح بسيار بالاي جامعيت گرايش دارد، از اينرو، فراخواني در بازيابي از نمايههاي خودكار، بالا؛ اما دقت، پايينتر است. يكي از چالشهاي اصلي در نمايهسازي خودكار، پيشبرد شيوههاي پايين آوردن جامعيت نمايهسازي از طريق تعيين موضوعات محوري يا ويژگيهاي برجسته پيامها و متون آنها بهمنظور گزينشيتر كردن نمايهسازي است.
نمايهسازي ذهني توسط انسان، گرايش به گزينشي بودن كامل دارد و آستانه اهميت بالا براي موضوعات، ويژگيها، و كاربردها را در نظر ميگيرد، در نتيجه، جامعيت آن پايين است. بههمين دليل بسياري از پايگاههاي اطلاعاتي، اين دو نوع نمايهسازي را با هم تركيب ميكنند، بهصورت تركيبي براي انواع خاصي از كاوشهاي با دقت بالا، به نمايهسازي توسط انسان؛ و براي انواع بهخصوصي از كاوش با فراخواني بالا، به نمايهسازي خودكار و اغلب تمام متن تكيه ميكنند.
تأثير جامعيت در خلاء صورت نميگيرد. اخصگرايي واژگان، نوع نحو، و پيوند دادن واژهها براي نشان دادن روابط عام، خاص، و ديگر روابط ميتواند اثر بالقوه جامعيت را كاهش يا افزايش دهد. بهعنوان مثال واژگان بسيار اخص كه مشخصه نمايهسازي خودكار است، در برخي موارد ميتواند به نتايج كاوش بسيار دقيق منجر شود كه با گرايش عمومي به نمايهسازي با جامعيت بالا در تضاد است.
روش نمايهسازي.
روشهاي نمايهسازي، شامل تحليل ذهني توسط انسان، تحليل الگوريتمي توسط ماشين، و يا تركيبي از اين دو رويكرد اصلي ميشود كه قبلا مورد بحث قرار گرفتند؛ در اينجا بار ديگر از باب تأكيد ذكر ميشود كه روش نمايهسازي يكي از ويژگيهاي مهم نظامهاي سازماندهي دانش و پايگاههاي بازيابي اطلاعات را تشكيل ميدهد.
نحو[35] . نحو بهدستور زبان نمايهسازي و كاوش اشاره دارد، يعني روش تركيب واژهها در قالب شناسهها و شناسههاي فرعي براي مدخلهاي نمايههاي چاپي و نمايههاي نمايشي در رسانههاي الكترونيكي؛ و يا براي خلق گزارههاي مركب و پيچيده كاوش بهمنظور كاوش الكترونيكي در نمايههاي غيرنمايشي. نحو، همچنين فنوني را براي اصلاح واژهها در كاوش دربر ميگيرد، از جمله ريشهيابي لغات براي برداشتن پسوندها و گاه پيشوندها، بهطوري كه لغات با ريشه يكسان در يك محل قرار گيرند، و كوتاهسازي[36] براي حذف حروف خاصي از ابتدا، انتها، و گاه از ميانه كلمات، نظير آنكه اگر علامت سؤال (؟) را نشانه عمل كوتاهسازي بدانيم، از تركيب “نمايه؟” ميتوان براي يافتن تمام كلماتي كه پنج حرف اول آنها “نمايه” است مثل نمايهها، نمايهساز، نمايهسازي، و مانند آن استفاده كرد. از فنون نحوي، براي مشخص كردن واژههايي كه در پاره متنهاي خاص، نظير يك جمله يا پاراگراف، بايد همراه يكديگر ظاهر شوند يا اينكه فاصله آنها نبايد بيش از تعداد خاصي لغت باشد نيز ميتوان استفاده كرد.
اگر نظامهاي سازماندهي دانش ابزار تركيب و اصلاح واژهها را فراهم نميكردند، كاوش اگر ناممكن نبود، بسيار مشكل ميبود. اگر كسي به نقشههاي مربوط به جنگهاي شهري امريكا علاقهمند باشد، مجبور است ابتدا همه مدخلهاي مربوط به نقشهها را بازيابي كند، سپس در ميان آنها بهدنبال مدخلهاي مربوط به جنگهاي شهري بگردد، و سرانجام در ميان مدخلهاي باقيمانده، آنها را كه مرتبط با امريكا هستند جدا كند. انجام اين فرايند بسيار طاقتفرسا در نظامهاي الكترونيكي ميسر است. اما اگر در نمايههاي چاپي امكان تركيب واژهها در قالب شناسهها وجود نداشته باشد، وضع بسيار بد خواهد بود. اگر چنين باشد، شخص بايد همه مدخلهاي مربوط به نقشه را بيابد، سپس بهصورت بصري در ميان همه آنها بهدنبال ارجاعاتي به امريكا و جنگهاي شهري آن بگردد.
خوشبختانه، همه نظامهاي سازماندهي دانش با هر درجه از اهميت، شيوههايي براي تركيب و تغيير اصطلاحات فراهم ميكنند. دو رهيافت اساسي براي كاوش الكترونيكي در نمايههاي غيرنمايشي وجود دارد. تعداد اين رهيافتها براي نمايههاي نمايشي بسيار بيشتر است.
نحو براي كاوشهاي الكترونيكي.
دو شيوه اصلي تركيب واژهها بهمنظور كاوشهاي الكترونيكي عبارتند از:1) منطق بولي؛ و 2) بردارهاي واژهاي توزين شده[37] كه گاه مبتني بر نمايهسازي احتمالگرا[38] هستند. هر دو روش را ميتوان با فنوني براي كوتاهسازي، ريشهيابي، و تعيين محل واژه و كلمات مجاور آن تركيب كرد.
كاوش با منطق بولي امكان تركيب واژهها با استفاده از عملگرهاي منطقي “و”، “يا”، و “نه” را فراهم ميسازد. زماني كه دو يا چند واژه با استفاده از “و” تركيب ميشوند، تنها اسنادي بازيابي ميشوند كه تمامي آن واژهها در نمايهسازي آنها بهكار رفته باشند. زماني كه دو يا چند واژه با استفاده از “يا” تركيب ميشوند، هر واحد سندي كه حداقل يكي از آن واژهها در نمايهسازي آن بهكار رفته باشد، بازيابي ميشود. اگر عملگر منطقي “نه” را قبل از يك واژه قرار دهيم، تمامي واحدهاي سندي كه با استفاده از آن واژه نمايه شدهاند، از بازيابي كنار گذاشته خواهند شد.
كاوش با منطق بولي، پايگاه اطلاعاتي را به دو بخش متقابلا انحصاري تقسيم ميكند: ركوردهايي كه واژههاي آنان با گزاره كاوش تطبيق ميكند و ركوردهايي كه واژههايشان تطبيق نميكند. ركوردهاي بازيابي شده، همگي داراي ارزش و وزن يكسان هستند. براي مرتبهبندي كردن ركوردها بر اساس ربط بالقوه آنها نسبت به گزاره كاوش، روش اساسي وجود ندارد؛ مگر اينكه فنون بردار واژهاي توزين شده يا فنون مبتني بر احتمالات را به كاوش با منطق بولي بيفزاييم.
بزرگترين نقيصه كاوش با منطق بولي، فقدان بازيابي مرتبهبندي شده[39] است. هر چه پايگاههاي اطلاعاتي بزرگتر ميشوند، مجموعههاي بازيابي شده نيز بزرگتر ميشوند، مگر اينكه عبارتهاي جستوجو را محدودتر سازيم تا تعداد ركوردهاي بازيابي شده كاهش يابد كه در اين صورت نيز خطر از دست دادن اسناد مهم افزايش مييابد.
مشكل ديگر كاوش با منطق بولي اين است كه عملگرهاي “و” و “يا” همان معناي معمول در زبان انگليسي را نميدهند. اگر كسي خواهان منابعي درباره جنگهاي شهري در امريكا و روسيه و انگليس و اسپانيا و يوگسلاوي سابق باشد واين پرسش رابه همين صورت به عبارت جستوجو با منطق بولي تبديل كند، نتيجه بازيابي احتمالا هيچ خواهد بود. همه اين “و”ها در اين عبارت در حقيقت معنايي معادل عملگر منطقي “يا” در منطق بولي دارند.
بردار واژهاي يا جستوجوي مبتني بر احتمالات، به سادگي مجموعهاي از واژههاي كاوش را با ركوردها تطبيق ميدهد و سپس برمبناي اين تطبيق، پايگاه اطلاعاتي را بهصورت يك سياهه مرتبهبندي شده بر اساس ربط پيشبيني شده (يا احتمالي) بازآرايي ميكند. اگر واژههاي كاوش عبارت باشند از: جنگ شهري، امريكا، انگليس، روسيه، اسپانيا، يوگسلاوي، و بوسني، آن دسته از اسنادي كه حاوي همه اين واژهها هستند، در مرتبه اول قرار ميگيرند؛ آنهايي كه همه بهجز يكي را دربر دارند، در مرتبه دوم قرار ميگيرند؛ آنهايي كه همه بهجز دو تا را دربر دارند، در مرتبه سوم قرار ميگيرند؛ و به همين ترتيب تا انتها. در اين مثال ساده همه واژهها داراي وزن يكسان هستند، اما هم واژههاي كاوش و هم واژههاي نمايه ميتوانند داراي وزن باشند. اگر مقياس توزين را از صفر تا صد در نظر بگيريم، واژه كاوش “جنگ شهري” ميتواند وزني معادل صد بيابد در حالي كه هر يك از شش كشور مذكور، وزن ده ميگيرند. اين نوع توزين، تضمين ميكند كه سندي كه نام چند يا حتي همه كشورهاي مذكور را بدون واژه جنگ شهري دربر دارد، از نظر رتبه، بالاتر از سندي كه واژه جنگ شهري را به همراه تنها نام يك كشور دربر دارد، قرار نخواهد گرفت.
در هنگام توصيف اسناد نيز ميتوان به واژههاي نمايه بر اساس اهميت آنها در ارتباط با موضوعات يا ويژگيهاي متن، وزن اعطا كرد. اين نوع توزين در نمايهسازي خودكار ميتواند مبتني بر بسامد حضور خود كلمه (شايد پس از ريشهيابي) و يا حضور كلمه و معادلهاي آن باشد كه با رجوع به يك اصطلاحنامه تعيين شدهاند.
در دهههاي آغازين توسعه پايگاههاي اطلاعاتي الكترونيكي، كاوش با منطق بولي به يك استاندارد بالفعل براي آنها مبدل شد. اما اين شيوه كاوش به مرور با استفاده از بردار واژهاي يا فنون مبتني بر احتمالات، جايگزين شده و يا تكميل ميشود. بازيابي مرتبهبندي شده مزاياي زيادي دارد، بهويژه زماني كه مجموعهاي كه از آن بازيابي ميشود خيلي بزرگ باشد.
نحو براي نمايههاي نمايش دادني.
نمايههاي قابل مشاهده، بهويژه آنهايي كه در پايگاههاي اطلاعاتي چاپي ارائه ميشوند، بايد پيش از آنكه به كاوشگر عرضه شوند، ساخته شده باشند. چنين نمايههايي را اغلب پيشهمارا[40] مينامند، چون واژهها قبل از انتشار، “همارا” يا با هم تركيب ميشوند. در مقابل، در كاوش الكترونيكي، اين كاوشگر است كه واژهها را براي كاوش تركيب ميكند. اينگونه نمايهسازي را كه براي كاوش الكترونيكي طراحي شده، اغلب پسهمارا[41] مينامند.
انواع نحو براي نمايههاي نمايش دادني را ميتوان در پنج دسته جاي داد: نحو تك موردي[42] ، نحو زبان طبيعي، نحو سرعنوانهاي موضوعي، نحو چرخشي[43] ، و نحو رشتهاي[44] .
نحو تك موردي.
زماني كه يك نمايه نمايش دادني براي يك سند واحد مثل نمايه انتهاي يك كتاب و يا يك نمايه پيشين براي مجموعهاي از اسناد تهيه ميشود، واژهها اغلب بهجاي اينكه بر اساس يك نظام نحوي از پيش تثبيت شده يا بر اساس فهرست سرعنوانها تركيب شوند، بر مبناي يك پايه و اساس تك موردي بهصورت شناسه – شناسه فرعي با هم تركيب ميشوند. نمايهساز، واژهها را بر اساس واژگان متن (اگر متن زباني باشد، با همان زبان نمايه) و نيز بر اساس واژههايي كه كاربران بالقوه انتظار دارند، انتخاب، و آنها را بهصورت تركيب شناسه – شناسه فرعي براي توصيف موضوعات، ويژگيها، و كاربردهاي واحد سندي ارائه ميكند.
در نمايههاي انگليسي زبان، مرسوم است كه از اسامي يا عبارات اسمي بهعنوان واژه، و براي اشياي مجزاي قابل شمارش از برگه جمع استفاده كنند. از حروف اضافه نيز به مقدار كم براي روشن كردن روابط ميان واژهها استفاده ميشود. يك نمايه خوب به حد كافي انواع مختلفي از شناسههاي فرعي را فراهم ميكند، طوري كه با افزودن تقسيمات فرعي زير يك شناسه در نمايه، از تراكم ارجاعات ذيل شناسه اصلي جلوگيري ميشود. استاندارد جديد سازمان استانداردهاي اطلاعاتي ملي امريكا ميگويد كه بيش از پنج واحد سندي نبايد ذيل يك تركيب شناسه ـ شناسه فرعي با هم باشند و در نمايه نبايد پس از هر شناسه يا تركيب شناسه ـ شناسه فرعي بيش از پنج جاينما[45] قرار گيرد (4). در روشهاي جديد، ترجيح ميدهند زبان طبيعي و نظم مستقيم براي اصطلاحات چند كلمهاي بهكار رود (بيمه آتشسوزي به جاي آتشسوزي، بيمه)، البته بهجز اسامي افراد كه مقلوب ميشوند و زير نام خانوادگي قرار ميگيرند. استانداردِ سازمان استانداردهاي اطلاعاتي ملي امريكا پيشنهاد كرده تنها اسامي خاص يا اعلام با حروف بزرگ نوشته شوند و استفاده از حروف تعريف به حداقل برسد و واژههايي كه معاني متفاوت دارند، ترجيحآ توضيحگر داشته باشند، مثل شير (لبنيات)، شير (حيوان). بسياري از اين قواعد براي ديگر اشكال نحو نمايهسازي نيز بهكار ميروند.
نحو سرعنوانهاي موضوعي.
سرعنوانهاي موضوعي در اواسط و اواخر قرن نوزدهم بهمنظور تدارك سرعنوانهاي همگون براي فهرستهاي موضوعي كتابخانهها ايجاد شد. بزرگترين و مشهورترين مجموعه سرعنوانهاي موضوعي عمومي، سرعنوانهاي موضوعي كتابخانه كنگره امريكاست (28). يكي از مشهورترين سرعنوانهاي موضوعي تخصصي، سرعنوانهاي موضوعي پزشكي كتابخانه ملي پزشکی(مش) است (33).
سرعنوانهاي موضوعي كتابخانه كنگره حاوي هزاران سرعنوان است كه از تك واژهها و واژههاي چندتايي بهصورت تركيبات سرعنوان ـ سرعنوان فرعي (مانند جانوران ـ بيماريها ـ شيمي درماني)، و عبارت (مانند برنامه كمك تلفني براي مستمندان) تشكيل شدهاند. در سالهاي اوليه، بسياري از واژهها مقلوب ميشدند (مانند خارجي، دانشجويان)، اما در شيوههاي رايج امروزي نظم مستقيم زبان طبيعي ترجيح داده ميشود. بااين حال، از آنجا كه توسعه سرعنوانهاي موضوعي كتابخانه كنگره طي چندين دهه صورت گرفته است، در توليد آنها طي اين سالها از الگوهاي متفاوتي استفاده شده است كه امروزه با هم همزيستي دارند. فقدان الگوي نحوي هماهنگ و ثابت يكي از شكايات اصلي از سرعنوانهاي موضوعي سنتي است. بهعنوان مثال مشكل ميتوان پيشبيني كرد كه يك سرعنوان جغرافيايي بايد قبل از يك سرعنوان موضوعي قرار گيرد يا بعد از آن. بهطور مثال در ميان سرعنوانها هر دو حالت “آرشيوها ـ ايالات متحده” و “ايالات متحده ـ منابع كتابخانهاي” بهكار ميرود. بههمين صورت، در مورد استفاده از اشكال صنعتي در مقابل اشكال اسمي، يا استفاده از تركيبات سرعنوان ـ سرعنوان فرعي در مقابل عبارتها نيز ناهمگوني وجود دارد. بهعنوان مثال اين سه مورد را در نظر بگيريد: “فيلمهاي حيوانات”، “حيوانات ـ فرهنگ عامه”، و “حيوانات در ادبيات”.
فهرست سرعنوانهاي موضوعي علاوه بر تركيبات پيش هماراسته “سرعنوان – سرعنوان فرعي” و سرعنوانهاي به شكل عبارت، گروهي سرعنوان فرعي (تقسيمات فرعي) استاندارد نيز دارد كه ميتوان آنها را با ديگر سرعنوانها تركيب كرد. سرعنوانهاي الگو كه براي اشخاص، شهرها، ملتها، و بسياري ديگر از مقولههاي موضوعي ارائه ميشوند، الگوهايي ايجاد ميكنند كه بر اساس آنها ميتوان به ايجاد تركيبات جديد سرعنوان ـ سرعنوان فرعي پرداخت. زنجيره “سرعنوان ـ سرعنوان فرعي ـ سرعنوان فرعي فرعي” به همين ترتيب ميتواند ادامه يابد و بسيار طولاني شود، از اينرو، حفظ هماهنگي ميان فهرستنويسهاي متعدد و گوناگون، كه چالش بزرگي است، استفاده از دستورنامههاي بزرگ را در مورد رويهها و روشها ضروري ميسازد (27).
با وجود انتقادهاي زيادي كه از سرعنوانهاي موضوعي ميشود، اين سرعنوانها پراستفادهترين شيوه براي نمايهسازي مجموعههاي كتابخانهاي هستند. بهطور مثال، در امريكا هر كتابخانه عمومي، با هر درجه از اهميت، از آنها استفاه ميكند و بههمين دليل سرعنوانها نوعي هماهنگي در ميان هزاران كتابخانه، براي دسترسي به مواد فراهم كردهاند. اكنون كه فهرست بسياري از بزرگترين كتابخانهها براي دستيابي الكترونيكي از تمام جهان روي اينترنت و در دسترس همگان قرار ميگيرد، اين سرعنوانها ميتوانند بسيار مفيد باشند.
برخي سرويسهاي نمايهسازي و چكيدهنويسي از سرعنوانهاي موضوعي براي شناسههاي اصلي خود استفاده ميكنند، اما شناسههاي فرعي را بهصورت موردي و بر اساس موضوعات، ويژگيها يا كاربردهاي اسنادي كه نمايهسازي ميشوند، ايجاد ميكنند.
نحو ردهبندي. نحو نظامهاي ردهبندي بسيار شبيه به نحو نظامهاي سرعنوانهاي موضوعي است. سرعنوانهاي معرف موضوعات مركب يا ويژگيها از پيش ساخته و سياهه شدهاند؛ يا اينكه ميتوان آنها را بر اساس قواعد خاص تركيب و ايجاد كرد. تفاوت اصلي آنها در شيوه مرتب كردن ردهها و سرعنوانهاست. از اينرو، توضيح در مورد نظامهاي ردهبندي، بعدآ ذيل مبحث “نمايشنمايه” ارائه خواهد شد.
نحو زبان طبيعي.
در نمايههاي مبتني بر زبان طبيعي نحو پارهمتنهاي زبان طبيعي (بهطور مثال عنوان آثار)، بهمنظور ايجاد مدخلهاي نمايه قابل جستوجو بههمان صورت طبيعي حفظ ميشود. اين مدخلها از يك كليد واژه بهعلاوه يك شناسه فرعي تشكيل شدهاند كه تمام يا بخشي از پارهمتن را دربر دارد. رايجترين نمونههاي نمايههاي نمايشيِ مبتني بر زبان طبيعي عبارتند از كوويك، كووك، و كواك. اين نمايهها معمولا با استفاده از الگوريتمهاي رايانهاي ايجاد ميشوند.
در نمايه كوويك (كليدواژه درون متن)، براي همه كليدواژههاي موجود در پاره متن، مدخل جداگانهاي ايجاد ميشود. كليدواژهها در وسط صفحه كاغذ يا صفحه نمايش بهترتيب الفبا مرتب ميشوند و متن پيراموني آنها در دو طرف كليدواژه قرار ميگيرد. نمونه مداخل نمايه كوويك را براي مقالهاي با نام >تاريخچه تحقيقات در علوم تربيتي< ميتوانيد در زير مشاهده كنيد[46] .
علوم تربيتي. تاريخچه تحقيقات درتربيتي. تاريخچه تحقيقات در علومتحقيقات در علوم تربيتي. تاريخچهتاريخچه تحقيقات در علوم تربيتي.
هر يك از مدخلهاي فوق در يك جاينما قرار ميگيرد تا محل واحد سندي را نشان دهد.
در نمايه كوويك، جفت كلمات و عبارات در كنار هم حفظ ميشوند. بهطور مثال دو كلمه تشكيلدهنده اصطلاح “علوم تربيتي” را ميتوان در كنار هم مشاهده كرد و در ميان تمام كليدواژههايي كه در آن كليدواژه “علوم” بهكار رفته قابل توجه است.
نمايه كووك براي تبعيت از شكل سنتيتر نمايه طراحي شده است كه در آن واژه كليدي در سمت راست (در متون انگليسي در سمت چپ) هر مدخل قرار ميگيرد. به مثال زير نگاه كنيد:
تاريخچه
تاريخچه تحقيقات در علوم تربيتي.
تحقيقات
تاريخچه تحقيقات در علوم تربيتي.
تربيتي
تاريخچه تحقيقات در علوم تربيتي.
علوم
تاريخچه تحقيقات در علوم تربيتي.
مشكل اين نوع ساختار اين است كه جفت كلمات و عبارات در كنار كلمه راهنما حفظ نميشوند. بالتبع اگر مدخلهاي ذيل كليدواژه “علوم” را در جستوجوي “علوم / تربيتي” بگرديم، بهجاي كلمه “تربيتي” ذيل “علوم” به “تاريخچه تحقيقات …” برميخوريم. در نمايه كووك نيز پس از مدخلها از جاي نما استفاده ميشود.
نمايه كواك به اين منظور ايجاد شد كه علاوه بر ارائه نمايه به شكل سنتي، يعني ارائه واژه راهنما در سمت راست (در زبان انگليسي در سمت چپ) هر مدخل، جفت كلمات و عبارات به همراه هم حفظ شوند. نمونه مدخلهاي اين نمايه را ميتوانيد در ادامه مشاهده كنيد :
تاريخچه
تحقيقات در علوم تربيتي.
تحقيقات
در علوم تربيتي. تاريخچه
تربيتي.
تاريخچه تحقيقات در علوم
علوم
تربيتي. تاريخچه تحقيقات در
در اينجا عبارات و جفت كلماتي كه با كليدواژه آغاز ميشوند، براي سادهترشدن جستوجو با همان توالي طبيعي ارائه ميشوند. مثل مدخل “علوم/ تربيتي: تاريخچه تحقيقات در”، اما كلماتي كه قبل از كليدواژه قرار ميگيرند، ديگر اتصال و همجواري طبيعي خود را نخواهند داشت، مثل كلمه “علوم” در مدخل “تربيتي./ تاريخچه تحقيقات در علوم”.
نحو چرخشي.
نحو چرخشي يا گردان بهاين منظور ايجاد شد كه حداكثر دسترسي را از طريق ارائه تمام حالات احتمالي تركيب لغات بهصورت دوتايي فراهم كند. عمل چرخش ميتواند بر اساس واژههاي منتسب شده يا كليدواژههاي استخراج شده از پارهمتنهاي زبان طبيعي، مثل عناوين آثار، صورت گيرد. در اصل، نحو چرخشي ميتوانست براي ايجاد تمامي تركيبات احتمالي سه يا بيش از سه كلمهاي مورد استفاده قرار گيرد، اما از آنجا كه با افزايش تعداد كلمات، تعداد مدخلها نيز بهصورت تصاعدي زياد ميشود، چرخش با بيش از دو كلمه عملي نيست. نمونه نحو چرخشي را در مورد عنوان انتقال فناوري و اطلاعات به ايران در زير مشاهده ميكنيد:
اطلاعات
انتقال
ايران
فناوري
انتقال
اطلاعات
ايران
فناوري
ايران
اطلاعات
انتقال
فناوري
فناوري
اطلاعات
انتقال
ايران
بعداز هر جفت دو كلمهاي يك جاينما براي نشان دادن واحد سندي قرار ميگيرد.در مدخلهاي چرخشي امكان جستوجوي “انتقال اطلاعات” نيز همانند “انتقال فناوري” وجود دارد، اما چنين چيزي بهصورت مستقيم در نمايههاي كوويك، كووك، و كوواك ميسر نيست، چرا كه دو كلمه “انتقال” و “اطلاعات” در پارهمتن اصلي فاقد همجواري مستقيم هستند. چرخش خودكار واژهها گاه باعث ايجاد تركيبات دوتايي بيمعني ميشود، مثل “انتقال/ ايران”؛ اما كارشناسانِ نمايههاي چرخشي اذعان ميكنند كه اين نوع “ريزشهاي كاذب” يا تركيبات غلط، ضرر چنداني ندارند، چرا كه كاربران بهندرت به آنها توجه ميكنند. آنها معتقدند كه دسترسي اضافي (كه از طريق ارائه همه تركيبات احتمالي واژهها فراهم ميشود) ارزش ناديده گرفتن چند تركيب بيمعني را دارد. در حقيقت اين تركيبات غلط بهخاطر تركيب واژههاي غيرمرتبط اصولا تفاوتي با ريزش كاذب در نظامهاي كاوش الكترونيكي ندارند.
مؤسسه اطلاعات علمي (آي.اس.آي.)[47] امريكا سالهاست كه از نمايههاي چرخشي[48] براي تكميل نمايههاي استنادي خود استفاده ميكند (21).
نحو رشتهاي.
نمايهسازي رشتهاي براي ايجاد مدخلهاي چندگانه از يك مجموعه واحد يا يك “رشته” از واژهها از الگوريتمهاي رايانهاي استفاده ميكند. براي اينكه نمايهساز بتواند واژهها را آمايش كند، ميتوان خود واژهها را تعيين و رمزگذاري كرد (9).
سادهترين شكل نمايهسازي رشتهاي عبارت است از چرخش واژهها، بهطوري كه هر واژه يك بار در موقعيت واژه راهنما ظاهر ميشود و ساير كلمات بهدنبال آن در نظم الفبايي ميآيند (1). شكلهاي پيشرفتهتر نمايهسازي رشتهاي تلاش ميكنند بر اساس يك نظم مفهومي معنيدار، واژهها را زير يك واژه راهنما مرتب كنند. اين نظم مفهومي در مقابل نظم ساده الفبايي است كه در نحو چرخشي استفاده ميشود. بهعنوان مثال، در نمايهسازي چهريزهاي[49] براي واژهها، چهريزه يا شاخص نقش تعيين ميشود و واژهها بر اساس همين چهريزهها و نقشها مرتب ميشوند. يكي از نخستين و پيشرفتهترين نظامهاي نمايهسازي چهريزهاي، نظام پرسي (نظام نمايهسازي با حفظ بافت) بود كه زير نظر درك آوستين* براي كتابشناسي ملي بريتانيا ابداع شد و بهصورت گسترده در بريتانيا و كانادا مورد استفاده قرار گرفت (5).
در نظامهاي عمومي نظير پرسي، چهريزهها و نقشها شامل مقولههاي خيلي عام هستند مثل محل، نظام يا وجود كليدي، بيانگر، عمل، و عامل يا ابزار. در مثال زير مجموعهاي از واژههاي رمزگذاري شده ديده ميشود كه بهدنبال آنها مدخلها بر اساس الگوريتمي مانند پرسي ارائه شده است:
]محل[ انگليس
]وجود كليدي[ ماشينهاي
]بيانگر[ كرهاي
]عمل[ فروش
]تعريفگر نقش[ تأثير/ بر
]عامل، ابزار[ تبليغات
انگليس
ماشينهاي كرهاي. فروش. تأثير تبليغات.
ماشينها. انگليس
ماشينهاي كرهاي. فروش. تأثير تبليغات.
ماشينهاي كرهاي. انگليس
فروش. تأثير تبليغات
فروش. ماشينهاي كرهاي. انگليس
تأثير تبليغات.
تبليغات. ماشينهاي كرهاي. انگليس
تأثير برفروش.
مدخلهاي فوق بهترتيب الفبا مرتب ميشوند و پس از هر مدخل جاينماهاي مناسب براي نشان دادن واحد سندي قرار ميگيرد.
زماني كه از نمايهسازي چهريزهاي براي يك رشته يا حوزه موضوعي خاص استفاده ميشود، چهريزهها اخصتر ميشوند. نمونهاي از اين نوع نمايهسازي را كه از يك كتابشناسي بينالمللي برگرفته شده، مشاهده ميكنيد(30).
]ادبيات[ ادبيات انگليسي.
]قالب ادبي[ داستان كوتاه.
]دوره[ 1900-1999
]نويسنده[ فورستر، اي. م.
]اثر[ “دكتر وولاكت”.[50]
]سبك[ سمبوليسم.
]مضمون[ رستگاري، همجنسگرايي
رستگاري
ادبيات انگليسي. داستان كوتاه. 1900-1999.
فورستر، ا.م. “دكتر وولاكت”، سمبوليسم.
راه رستگاري؛ همجنسگرايي
سمبوليسم
ادبيات انگليسي. داستان كوتاه. 1900-1999.
فورستر، ا.م. “دكتر وولاكت”، سمبوليسم.
راه رستگاري؛ همجنسگرايي
همجنسگرايي
ادبيات انگليسي. داستان كوتاه. 1900-.1999
فورستر، ا. م. “دكتر وولاكت”، سمبوليسم.
راه رستگاري؛ همجنسگرايي
نظام نمايهسازي عبارات درون علامت (نفيس)[51] كه تيموتي كريون ابداع كرد (9)، شيوهاي براي رمزگذاري يك گزاره موضوعي بهمنظور ساختن مدخلهاي چندگانه فراهم ميكند. اين گزارهها را ممكن است نمايهساز ايجاد كند يا پارهاي از متن، مثل عنوان اثر باشد. در اين نظام از چهار علامت براي رمزگذاري استفاه ميشود: گوشه يا جفت علامت زاويهاي براي كلماتي كه بايد زير آنها مدخل ساخته شود؛ علامت @ كه مدخل خودكار زير نخستين كلمه يك گزاره يا عبارت را نفي ميكند؛ و علامت سئوال (؟) كه نشاندهنده اتصالات ميان واژهها و عبارات (معمولا حروف اضافه) است. بهطور مثال براي گزاره رمزگذاري شده، مدخلهاي ذيل ايجاد ميشود:
@ تأثير؟ >تبليغاتفروش؟ >ماشينهاي< ؟ كرهاي انگليس<
انگليس
فروش ماشينهاي كرهاي. تأثير تبليغات بر
تبليغات
تأثير، بر فروش ماشينهاي كرهاي در انگليس.
فروش
ماشينهاي كرهاي در انگليس. تأثير تبليغات بر
ماشين
كرهاي .- فروش در انگليس. تأثير تبليغات
ماشينهاي كرهاي
فروش در انگليس. تأثير تبليغات
نمايهسازي زنجيرهاي[52] .
اين نوع نمايهسازي مدتها قبل از آنكه رايانهها و الگوريتمهاي رايانهاي پا به عرصه سازماندهي دانش بگذارند، شكل گرفت. برخي بر همين اساس استدلال ميكنند كه نمايهسازي زنجيرهاي نوعي نمايهسازي رشتهاي[53] نيست. با اين همه، اين روش نيز به انواع ديگر نمايهسازي رشتهاي شباهت دارد و در برخي موارد امكان توليد الگوريتمي نمايههاي زنجيرهاي نيز وجود دارد (39: 351-364). در نمايهسازي زنجيرهاي، بر اساس سرعنوانهايي كه نشانههاي ردهبندي معرف آنها هستند، رشتههايي از يك يا چند واژه، ايجاد ميشود. اگر تعداد واژهها بيش از يكي باشد ترتيب واژهها معكوس ميشود؛ براي هر يك از سطوح ردهبندي يك مدخل ايجاد ميگردد واز اين طريق يك نمايه الفبايي مستقيم براي همه موضوعاتِ تحت پوشش ايجاد ميشود. نمونه بسيار سادهاي از اين نوع نمايه بر اساس ردهبندي ديويي در ادامه ارائه شده است.
300 علوم اجتماعي
330 اقتصاد
336 ماليه عمومي
2/336 ماليات
علوم اجتماعي 300
اقتصاد. علوم اجتماعي 330
ماليه عمومي. اقتصاد. علوم اجتماعي 336
ماليات. ماليه عمومي. اقتصاد. علوم اجتماعي 2/336
بسياري از اين واژهها در متن اين مدخل زائد هستند و با حذف آنها ميتوان مدخلهاي زير را ايجاد كرد :
علوم اجتماعي 300
اقتصاد 330
ماليه عمومي. اقتصاد 336
ماليات. ماليه عمومي. اقتصاد 2/336
اين مدخلها بهترتيب الفبا مرتب ميشوند.
از نمايهسازي زنجيرهاي تنها ميتوان به همراه يك نظام ردهبندي خاصي استفاده كرد كه آن نيز بهنوبه خود براي واحدهاي سندي معيني كه بايد نمايه شوند بهكار برده ميشود. نمايه اصلي بهترتيب رده مرتب ميشود. نمايه زنجيرهاي براي موضوعاتي كه تحت پوشش نظام ردهبندي قرار دارد، يك نمايه ثانويه الفبايي تهيه ميكند.
اخصگرايي[54] واژگاني.
ميزان اخصگرايي واژگان مورد استفاده براي توصيف موضوعات، ويژگيها، و كاربردها بر انواع كاوشهايي كه يك نظام سازماندهي دانش ميتواند پشتيباني كند، و برنتايج آنها تأثير ميگذارد. اخصگرايي، ميزان دقتي است كه يك واژه، موضوع، ويژگي، يا كاربرد خاصي را توصيف ميكند. اگر پيامي درباره سگهاي شكاري باشد، اما واژه نمايهاي كه به آن منتسب شده، “سگها” باشد، بايد گفت اين واژه اعم است نه اخص. اين امر بدان معناست كه اگر كسي متقاضي اسنادي درباره سگهاي شكاري باشد، بايد كاوش خود را با واژه “سگها” انجام دهد و سپس بسياري از مدارك نامربوط يا مدارك انتسابي را كه بازيابي شده، وارسي كند تا ركوردهاي مرتبط با سگهاي شكاري را در ميان آنها بيابد. از سوي ديگر اگر واژه نمايه “سگهاي شكاري” باشد، واژه اخص است و كاوش دقيقتر خواهد بود. اما ممكن است فراخواني كاهش يابد، چرا كه ممكن است سگهاي شكاري، در كنار ديگر سگها مورد بحث قرار گرفته باشند و با استفاده از واژه “سگها” نمايه شده باشند نه “سگهاي شكاري”.
استانداردهاي نمايهسازي ترجيحآ مدافع اخصگرايي بيشتر در زبان نمايهسازي هستند، چرا كه با مديريت خوب واژگان ميتوان در مواقع لزوم، جستوجو را به سطوح عامتر توسعه داد. از سوي ديگر، در واژگان اخصتر، تعداد واژهها بيشتر خواهد بود. نگهداري واژگان كنترل شده بزرگتر، پرهزينهتر است و استفاده از آن در مقايسه با واژگان كوچكتر، سختتر است. در نمايهسازي كه مستقيمآ بر واژههاي بهكار رفته در متون زباني مبتني باشد، همانطور كه در بيشتر شيوههاي نمايهسازي خودكار چنين است، اخص بودن واژههاي نمايه به اندازه اخص بودن واژههاي بهكار رفته در متن است.
آن دسته از نظامهاي نمايهسازي كه هم متكي بر واژگان كنترل شده هستند (كه بر مبناي تحليل ذهني به سند منتسب ميشوند) و هم از نمايهسازي خودكار (كه مبتني بر واژههاي استخراج شده از متن است) بهره ميبرند، در حقيقت از تفاوتهاي اين دو شيوه به نفع اخصگرايي و براي توازن بخشيدن به مزايا و معايب آنها استفاده ميكنند.
مهار واژگان.
به خاطر گوناگوني فراوان در استفاده انسان از زبان، اعمال نوعي مهار واژگان در كل فرايند بازيابي اطلاعات ضروري است. اگر خود نظام سازماندهي دانش نوعي مديريت واژگان تدارك نبيند، كاربر مجبور خواهد بود خود با آزمودن شيوههاي مختلفي كه يك مفهوم خاص را ميتوان با آنها بيان كرد، اين كنترل را اعمال كند.
هدف مهار واژگان عبارت است از تدارك پيوند ميان واژههايي كه مترادف هستند يا در نظام مربوط معادل تلقي ميشوند. بدين ترتيب، شخص از هر واژه كه با آن كاوش را آغاز كرده است به ساير واژهها كه از حيث دامنه محدودترند (واژه اخصتر) يا با هم روابط مهم ديگري دارند، هدايت ميشود. در برخي نظامها به واژههاي عامتر نيز اشاره ميكنند.
روابط واژگان مهار شده بايد با نمايه يكپارچه و جزئي ازآن باشد. كاربر نبايد مجبور باشد براي استفاده از آن به اصطلاحنامه مجزا يا فهرست سرعنوانهاي موضوعي مراجعه كند و ارجاعات متقابل را دنبال كند و سپس به نمايه باز گردد. اين امر در مورد نمايههاي نمايشي بدان معناست كه ارجاعات متقابل بايد در نمايه نمايش داده شوند. در مورد نمايههايي كه جستوجو در آنها بهصورت الكترونيكي صورت ميگيرد، نمايش واژههاي جايگزين بايد بخشي از رابط جستوجو[55] باشد.
اگر كاربر كلمه “حقوقدان” را بهعنوان واژه جستوجو در مرتبط جستوجو وارد كند، واژههاي مرتبط بايد بهصورت خودكار يا بنا به درخواست وي نمايش داده شوند. ميتوان از يك پنجره براي فهرست كردن واژههاي معادل (مانند: وكيل، مشاور حقوقي)، واژههاي خاصتر (مانند: وكيل پايه دوم)، واژههاي عامتر (پرسنل نظام قضايي)، و واژههاي مرتبط (جرم، قانون، عدالت، دادگاه) استفاده كرد. اگر از واژگان كنترل شده استفاده شود، كاربر بايد آگاه باشد كه واژه نخستين (حقوقدان) به واژه تثبيت شده “وكيل” تبديل شده است (و يا برعكس). كاربر بايد اين امكان را داشته باشد كه هر واژه ديگري را به كاوش بيفزايد، يا اينكه واژههاي نمايش داده شده را جايگزين واژههاي اصلي كند. همچنين بايد امكان استفاده از اصطلاحنامه در مورد هر يك از واژههاي نمايش داده شده بهمنظور ديدن واژههاي خاصتر، عامتر، و مرتبط نيز وجود داشته باشد. بايد بتوان هر يك از واژههاي انتخاب شده را مستقيمآ به كاوش افزود. كاربر نبايد مجبور به تايپ مجدد هيچيك از آنها باشد.
با استفاده از جزء مديريت واژگان در يك نظام سازماندهي دانش، كاربر ميتواند با جايگزين كردن واژههاي اخص كه چه بسا با هدف كاوش مناسبت بيشتري داشته باشند، كاوش را محدودتر كند و يا با افزودن واژههاي اضافي يا جايگزين كردن واژه كاوش با واژههاي اعم، كاوش را وسيعتر كند.
جانشينسازي[56] .
واحدهاي سندي كه در پايگاه بازيابي اطلاعات سازماندهي ميشوند، بايد به نحوي بازنموده شوند. در پايگاههاي اطلاعاتي تمام متن، كل متن ارائه ميشود. اما در پايگاههاي اطلاعاتيِ ارجاعي، كه استفادهكننده را به اسنادي ارجاع ميدهند كه در پايگاه وجود ندارند، به يك نماياننده نياز است. اين نمايانندهها معمولا شامل توصيف واحدهاي سندي يا استناد به آنها هستند و گاه چكيده يا خلاصهاي از محتويات، ويژگيها، و كاربردهاي احتمالي واحدهاي سندي را نيز دربرميگيرند.
در داخل پايگاههاي اطلاعاتي تمام متن، مثل كتابها، به همراه نمايه پايان كتاب، نوعي نظام بازنمايشي داخلي لازم است. بهطور مثال در نمايه انتهاي كتاب، اغلب از شماره صفحه يا شماره پاراگراف براي ارجاع به واحدهاي سندي داخل متن استفاده ميشود. در پايگاههاي اطلاعاتي الكترونيكي معمولا از پيوندهاي دروني[57] يا اشارهگرها[58] استفاده ميشود.
نمايش ركورد[59] .
نماياننده واحد سندي، خواه مختصر خواه متن كامل، بايد به نحوي به كاربر نشان داده شود. در نمايش يكجا، همه اطلاعات مربوط به يك واحد سندي خاص در يك محل گردآوري ميشود و كاربر در آنجا ميتواند توصيف يا مشخصات كتابشناختي يا چكيده متن يا خلاصه آن را بهعلاوه واژههاي نمايهايِ داده شده مربوط به آن واحد سندي را ببيند. رؤيت همه واژههاي نمايه در كنار هم، اگر همانند برخي موارد در نمايهسازي الكترونيكي بيش از حد زياد نباشند، ميتواند براي توصيف موجز محتوا يا ويژگيهاي يك واحد سندي، و نيز براي گسترش يا تغيير جهت كاوش با استفاده از برخي واژههاي به نمايش در آمده، مفيد باشد. بسياري از پايگاههاي اطلاعاتي چاپي، نمايش يكجا را بهمنظور صرفهجويي در فضا حذف ميكنند، بدين معني كه واژههاي نمايه تنها در خود نمايه سياهه ميشوند. در نمايه نيز جاينماهاي مختصر، كاربر را به جانشينهاي مفصلتر (اما ناقص) در بخش ديگري از پايگاه اطلاعاتي ارجاع ميدهند.
پايگاههاي اطلاعاتي الكترونيكي اغلب گزينههايي را براي انتخاب گستردگي و سبك نمايش به كاربر عرضه ميكنند. نمايش مختصر در اين پايگاهها ميتواند تنها شامل عنوان و نويسنده باشد. نمايش كمي مفصلتر ميتواند شامل توصيف يك يا تمامي اطلاعات كتابشناختي باشد. نمايش كامل ميتواند چكيده، فهرست مدخلهاي نمايه، و حتي متن كامل را نيز دربر گيرد.
توليدكنندگان پايگاههاي اطلاعاتي براي طراحي اشكال كارآمد نمايش ركوردها، كه درك آنها ساده و روشن باشد، سخت ميكوشند.
نمايش نمايه.
نمايش نمايه در پايگاههاي اطلاعاتي چاپي ضروري است، چرا كه دسترسي به واژهها و شناسههاي معرف موضوعات، ويژگيها، و كاربردهاي واحدهاي سندي را تنها با نمايش نمايه ممكن مينمايد. نمايش نمايه در محيطهاي الكترونيكي نيز ميتواند بسيار مفيد باشد، چرا كه به كاربر اجازه ميدهد قبل از كاوش يا در طول كاوش، نظري اجمالي به شناسهها بيندازد. تحقيقات روانشناختي ديري است تأييد كردهاند كه بازشناسي واژههاي مرتبط براي انسان سادهتر از فراخواني آنها از حافظه است. اين مسئله بهويژه در مورد موضوعاتي كه كاوشگر با آنها آشنا نيست، بيشتر صدق ميكند. نمايش كارآمد نمايه، گزينههاي جانشين را براي كاوش عرضه ميكند. نمايش مهار واژگان نيز براي اين منظور ميتواند بسيار سودمند باشد
نمايهها را ميتوان به دو شيوه اساسي نمايش داد: الفبايي ـ عددي[60] كه مبتني بر حروف و اعدادي است كه شناسههاي نمايه را شكل ميدهند؛ و رابطهاي (نسبي)[61] ، كه در اين مورد شناسههايي كه معرف موضوعها يا ويژگيهاي مشابه يا مرتبط هستند، با هم گروهبندي ميشوند.
نمايشهاي رابطهاي را بيشتر نمايشهاي ردهاي مينامند، و در واقع ميتوانند مبتني بر نظامهاي ردهبندي نظير ردهبندي دهدهي جهاني، ردهبندي دهدهي ديويي، ردهبندي كتابخانه كنگره، و انواع ديگر باشند .اين نحوه آرايش ردههاست كه ويژگي نمايش نمايههاي ردهاي را مشخص ميكند و ترتيب ردهها مبتني بر روابط آنهاست. از اينرو، آنها را نمايشهاي رابطهاي ميناميم.
نمايش الفبايي عددي.
اكثر نمايههاي قابل نمايش، الفبايي يا الفبايي ـ عددي هستند. در نظر اول، نظم الفبايي عددي، قابل فهم و بدون مشكل است، اما اهل حرفه اطلاعرساني بر سر آن اختلاف زياد دارند. اين يكي از حوزههايي است كه ديدگاههاي موجود در آن مبتني بر پژوهش تجربي نيست.
مجادلههاي اصلي بر سر موارد زير است: آيا بايد در حين مرتبسازي نويسهها[62] ، فضاي خالي ميان كلمات و علائم
نقطهگذاري را نيز نويسه در نظر گرفت يا خير؟، با اعداد چگونه بايد برخورد كرد؟، آيا بايد از معياري غير از نويسههاي تشكيلدهنده شناسهها استفاده كرد يا خير؟ بسته به اينكه در موارد فوق چه گزينهاي انتخاب شود، آرايشهاي بسيار متفاوتي ميتواند حاصل شود و استفادهكنندهاي كه اصول آرايش بهكار رفته را درك نميكند، ممكن است برخي از مدخلهايي را كه بهدنبال آنهاست، به خاطر فاصله زياد از دست بدهد.
اگر فضاي خالي ميان كلمات را در آرايش لحاظ كنيم، آن آرايش كلمه به كلمه است و نه حرف به حرف، چرا كه شناسههايي كه با يك كلمه آغاز ميشوند با هم ميآيند[63] .
آرايش حرف به حرف آرايش كلمه به كلمه
گل آرايي گل آرايي
گل ارغواني گل ارغواني
گلايه گل ريواس
گلدان گل ياس
گل ريواس گلايه
گلزار گلدان
گل ياس گلزار
استانداردهاي قديميتر ايجاب ميكنند كه براي مرتب كردن اعداد، آنها را آنگونه در نظر بگيريم كه با حروف الفبا مينويسيم؛ در حالي كه استانداردهاي جديد ايجاب ميكنند كه اعداد را بهعنوان عدد و بر اساس نظم رياضي و قبل از حروف الفبا مرتب كنيم. اما حتي در اين روش نيز اختلاف نظر وجود دارد كه آيا آرايش بايد مبتني بر شكل واقعي نويسه باشد يا مبتني بر ارزش رياضي آن. بهطور مثال آيا ¼ را بايد در محل 25/0 كه ارزش رياضي آن است قرار داد يا بايد آن را بر مبناي نويسههاي آن يعني “1”، “/” و “4” مرتب نمود. اعداد رومي (I,V,X) را معمولا بر مبناي ارزش عددي آنها مرتب ميكنند نه بر اساس حروف الفباي آنها.
يكي از بحثانگيزترين حوزهها، آرايش بر اساس معيارهاي فرا ـ الفبايي ـ عددي[64] است. بهطور مثال كتابخانه كنگره هنوز اصرار دارد كه شناسههايي كه با يك كلمه آغاز ميشوند، نبايد بر اساس كلمات پس از كلمه آغازين مرتب شوند، بلكه بايد بر اساس ماهيت وجودي، كه نمايانگر آن است، و شكل شناسه بهترتيب زير مرتب شوند: اشخاص با نام كوچك، اشخاص با نام فاميل، اسامي مكانها و تنالگانها، شناسههاي موضوعي، و عناوين متون (26). اين بدان معناست كه يك عنوان نظير “پاريس پس از جنگ” بعد از نام شخصي به اسم “پاريس، ويرجينيا” و نيز پس از مدخل “پاريس (فرانسه)” قرار ميگيرد. اين اصول بهندرت براي كاربران بيان ميشوند. به همين دليل استاندارد جديد سازمان استانداردهاي اطلاعاتي ملي امريكا مشوق اِعمال حداقل استثنا در آرايش مدخلها بر مبناي نويسههاي موجود، از جمله فضاي خالي است. بر اساس اين استاندارد، علائم نقطهگذاري را بايد ناديده گرفت يا آنها را فضاي خالي تلقي كرد، چرا كه هيچ آرايش استانداردي براي علائم غيرالفبايي وجود ندارد. اعداد از جمله اعداد رومي بايد قبل از حروف الفبا قرار گيرند و بر مبناي نظم رياضي مرتب شوند (4).
نمايش رابطهاي يا ردهاي.
نظام ردهبندي، واژگان كنترل شدهاي است كه از بسياري جهات به فهرست سرعنوانهاي موضوعي شباهت دارد. در نظام ردهبندي نيز واژهها يا مقولهها به واحدهاي سندي منتسب ميشوند، به همان صورتي كه سرعنوانهاي موضوعي منتسب ميشوند. تفاوت اصلي ميان نظامهاي سرعنوانهاي موضوعي و نظامهاي ردهبندي در آرايش سرعنوانها يا ردههايي كه توسط سرعنوانها بازنمايي شدهاند، نهفته است. سرعنوانهاي موضوعي بهصورت الفبايي ـ عددي مرتب ميشوند، اما در نظامهاي ردهبندي، سرعنوانها (يا ردهها) برحسب روابط ميان آنها مرتب ميشوند.
آرايش رابطهاي ردهها مبتني بر عضويت چهريزهاي[65] ، سلسله مراتب، ترتيب زماني، و ديگر همبستگيهاست و زماني كه هيچ معيار آشكاري معلوم نيست، مبتني بر نظم الفبايي ـ عددي سرعنوان ردهاي[66] است.
ملاك اوليه آرايش ردهها بهمنظور سازماندهي دانش، چهريزهها هستند. چهريزهها مقولههاي اصلي پديدهها نظير رشتهها (يا حوزههاي كلي دانش)، وجود، خصيصهها، عملكردها، مكانها، و زمانها هستند. بيشتر نظامهاي ردهبندي براي سازماندهي دانش، در ابتدا مبتني بر چهريزه رشتهاي هستند. بهطور مثال، ردهبندي دهدهي ديويي در ابتدا رشتهها (و حرفههاي مرتبط) را كه به تمام حوزههاي دانش ميپردازند، مثل كتابداري و اطلاعرساني، روزنامهنگاري، و پردازش رايانهاي دادهها رديف ميكند؛ سپس به فلسفه، روانشناسي و دين؛ و پس از آن به علوم اجتماعي، زبان، علوم طبيعي و كاربردي، هنر، ادبيات، و تاريخ ميرسد (11).
در درون چهريزههاي رشتهاي، ماهيت و نظم چهريزههاي تابع، متغير است. در ادبيات، آرايش بر اساس چهريزههاي زبان يا مليت، قالب ادبي و دوره ادبي صورت ميگيرد. نويسندگان و آثارشان زير دوره تاريخي مربوط مرتب ميشوند. در داخل يك چهريزه، آرايش ميتواند مبتني بر سلسله مراتب (موضوعات اعم قبل از موضوعات اخص)، ترتيب زماني (دورههاي كهنتر قبل از دورههاي جديد)، و يا برخي مبناهاي ديگر كه معنيدار بهنظر ميرسند، باشد.
نظامهاي ردهبندي براي سازماندهي دانش، بهمنظور حفظ نظمي كه در ميان و درون چهريزهها ايجاد شده، از نشانهگذاري استفاده ميكنند. همين كه نشانهها به سرعنوانهاي موضوعي و خصيصهاي منتسب شدند، نظم رابطهاي آنها از طريق مرتب نمودن نشانهها بهترتيب الفبايي – عددي حفظ ميشود.
طرحهاي اوليه ردهبندي تمايل داشتند ردههاي تك مفهومي و چند مفهومي را به طرقي بر شمرده و مرتب سازند كه براي خالقان آنها مناسب به نظر ميرسيدند. اين طرحها را طرحهاي ردهبندي شمارشي[67] مينامند. ردهبندي كتابخانه كنگره در اصل از اين نوع است. از زماني كه ردهبندي دهدهي ديويي در 1876 پديد آمد، ويژگيهاي تركيبي بيشتر و بيشتري به طرحهاي ردهبندي افزوده شده است. اين ويژگيها امكان خلق ردههاي مركب را از طريق تركيب ردههايي از چهريزههاي ثانويه مختلف (مكانها، دورهها، شكلها، رفتارها، و انواع اشخاص) با ردههاي اصلي ذيل رشتهها فراهم ميكنند. ويژگي تركيب، در ردهبندي دهدهي جهاني توسعه بيشتري يافت، كه در ابتدا بهعنوان اقتباس و بسط ردهبندي ديويي پديد آمد. اين نظامها را ميتوان ردهبنديهاي تركيبي[68]ناميد.
در ردهبنديهاي چهريزهاي، اصل تحليل و تركيب چهريزهاي بهصورت بسيار محكمتر ومنظمتر از آنچه كه در ردهبندي شمارشي قديمي انجام ميشود، صورت ميگيرد. يك نمونه از آنها، ردهبندي چهريزهاي كتابداري و اطلاعرساني[69] است كه از 1971 تا 1992 براي نمايهسازي اسناد در ليزا بهكار ميرفت (29).
فهرست گزينهها[70] و نمايشهاي فرامتني[71] .
از فهرستهاي مبتني بر ردهبندي و نمايشهاي رابطهاي بهصورت گسترده براي هدايت كاربران، بهويژه كاربران مبتدي، به سوي تشكيلات پايگاههاي الكترونيكي يا متون استفاده ميشود. معمولا در هر فهرست گزينه، فقط بين ده تا پانزده گزينه ارائه ميشود و كاربر بايد گزينهاي را كه نزديكتر به هدف وي است، انتخاب كند. پايگاههاي اطلاعاتي بزرگ، نيازمند سطوح گزينهاي زياد مثلا ده، بيست، يا سي هستند و هدايت چنين گزينههايي ميتواند چالش برانگيز باشد. كاربران با تجربه اغلب ترجيح ميدهند فهرستهاي گزينه را كه بسيار وقتگير هستند، دور بزنند و كاوش را مستقيمآ با يك يا چند واژه انجام دهند يا اينكه به سير در نمايههاي الفبايي بپردازند.
فرامتن، بهمنظور نمايش نوعي نمايهسازي دروني توسعه يافت كه در دايرهالمعارفها و دستنامههاي چاپي مرسوم بود كه هر جا واژههايي خود مدخل بودند، برجسته ميشدند؛ و در آن كاربراني كه ميخواهند موضوع يا ويژگي ارائه شده توسط يك چنين واژهاي را دنبال كنند، ميتوانند مستقيمآ به مدخل همان واژه رجوع كنند. فرامتن، همين نوع دسترسي مستقيم را فراهم ميكند، بدون اينكه لازم باشد كاربر به نمايه رجوع كند. كاربر ميتواند روي هر واژهاي كه بر جسته شده، تقهبزند تا متن (بصري، صوتي، يا زباني) مرتبط با آن واژه روي صفحه ظاهر يا با استفاده از سيستم صوتي پخش شود.
ارزيابي.
نظامهاي سازماندهي دانش تقريبآ پيچيده هستند و هميشه در مورد ارزيابي ميزان كارآمدي آنها چالش وجود داشته است. از زمان جنگ دوم جهاني تحقيقات متعددي با استفاده از نظامهاي آزمايشي كه دستيابي به تعداد محدودي سند را فراهم ميكردند، صورت گرفت (38). در اين تحقيقات آزمايشي اغلب از استفاده كننده با پرسش واقعي استفاده نميشد. در اينكه از اين تحقيقات چيز چنداني نياموختهايم، اجماع وجود دارد؛ علت هم آن است كه پايگاههاي مصنوعي كوچك بازيابي اطلاعات، همان نوع مسائلي را كه حقيقتآ وجه مشخصه پايگاههاي بزرگ هستند، نشان نميدهند. علاوه بر اين، متغيرترين و غير قابل پيشبينيترين عنصر در جستوجوي اطلاعات، كاربر يا مراجعه كننده و نياز و تقاضاي اطلاعاتي وي است. زماني كه كاربران واقعي با پرسشهاي واقعي در تحقيق غالب نباشند، نتيجه نيز بسيار غير واقعيتر از آن خواهد بود كه راهنمايي سودمند فراهم كند.
يكي از نخستين تلاشها براي ارزيابي ميزان كارآمدي يك نظام بازيابي واقعي و بزرگ، مطالعهاي بود كه لنكستر، اف. ويلفريد در دهه 1960 روي نظامهاي تجزيه و تحليل و بازيابي متون پزشكي (مدلارز)انجام داد (24: 119-142) وي روش تحليل شكست[72] را، كه با آن ميتوان علل شكست كاوش را مشخص كرد، بهبود بخشيد. از آن پس تحقيقات روز افزوني بر مطالعه روي كاربران واقعي با نيازها و تقاضاهاي اطلاعاتي واقعي و تعامل آنها (يا تعامل واسطهاي حقيقي) با نظامهاي واقعي سازماندهي دانش متمركز شده است.
تاكنون تحقيقات، مسائل مربوط به بهترين راه براي سازماندهي دانش را حل نكردهاند. اما در عوض مزايا و معايب انواع رويكردها و نظامها را نشان دادهاند. نتيجه كلي اين است كه رويكردها و نظامهاي متفاوت، مكمل يكديگرند و براي رسيدن بهبهترين نتايج در كاوش، بايد از انواع فنون استفاده كرد.
نيز نگاه كنيد: ردهبندي؛ فهرستنويسي؛ و نمايهسازي
مآخذ:
1)American Bibliographical Center. America History and Life. US: ABC-Clio, 1980; 2) Anderson, J.D. “Indexing Systems: Extensions of the Mind’s Organizing Power”. Information and Behavior, 1 (1985): 287-323; 3) Anglo American Cataloguing Rules. 2nd. ed. Canadian Library Association, Library Association Publishing Ltd; American Library Association, 1988; 4) ANSI/NISO. Proposed American National Standard Guidelines for Indexes and Related Information Retrieval Devices, Z39. 4-199 X. [sl]: National Information Standards Organization, 1993; 5) Austin, D.; Dykstra, M. PRECIS: A Manual of Concept Analysis and Subject Indexing. 2nd. ed. [England]: British Library, Bibliographic Services Division, 1984; 6) Bates. M. “Rigorous Systematic Bibliography”. RQ, 16 (1976): 7-26; 7) Belkin, N.J.; Croft, W. B. “Information Filtering and Information Retrieval: Two Sides of the Same Coin?”. Communications of the ACM. Vol. 35, No. 12 (1992): 29-38; 8) Collantes, L.Y. “Degree of Agreement in Naming Objects and Concepts for Information Retrieval”. Journal of the American Society for Information Science, 46 (1995): 116- 132; 9) Craven, T.C. String Indexing. [sl]: Academic Press, 1986; 10) Deerwester, S.C., and [et.al]. “Indexing by Latent Semantic Analysis”. Journal of the American Society for Information Science, 41 (1990): 391-407; 11) Dewey Decimal Classification and Relative Index. 20th.ed. [us]. Forest Press Division of OCLC Online Computer Library Center, 1989; 12) Doszkocs, T.E. “An Associative Interactive Dictionary (AID) for Online Bibliographic Searching”. American Society for Information Science. Proceedings. 41st. Annual Meeting, (New York, Nov. 13-17, 1978). Vol. 15: The Information Age in Perspective. [New York]: Knowledge Industry Publications, 1978, PP. 105-109; 13) Fetters, L.K. A Guide to Indexing Software. 4th. ed. [us]: American Society of Indexers, 1992; 14) Fidel, R. and [et.al]. editor. Challenges in Indexing Electronic Text and Images. US: American Society for Information Science/Learned Information. Inc, 1994; 15) Fugmann, R. Subject Analysis and Indexing: Theoretical Foundation and Practical Advice. [sl]: Indeks Verlag, 1993; 16) Furnas, G.W. and [et.al]. “The Vocabulary Problem in Human-System Communication”. Communications of the ACM. Vol. 30, No. 11 (1987): 964-971; 17) Gluck, M. “Special Topic Issue: Spatial Information”. Journal of the American Society for Information Science, 45 (1994): 639-717; 18) Hayes-Roth, F.; Jacobstein, N. “The State of Knowledge-Based Systems”. Communications of the ACM. Vol. 37, No. 3 (1994):27-39; 19) Humphrey, S.M. “The MedIndEx Prototype for Computer Assisted MEDLINE Database Indexing”. American Society of Indexers 25th. Annual Meeting. Proceedings: Indexing, Providing Access to Information: Looking Back, Looking Ahead. [US]: ASI, 1993, PP. 45-54; 20) Iivonen, M. “Effect of Extending the Scope of Search Concepts on the Intersearcher and Intrasearcher Consistency”. in H.Albrechtsen and S. Oernager, editor. International Society for Knowledge Organization. 3rd. International Conference,20-24 June 1994, Copenhagen, Denmark. Proceedings:Knowledge Organization and Quality Management.[Denmark]: Index Verlag, 1994, PP. 423-430; 21) Institute for Scientific Information. Arts and Humanities Citation Index; Science Citation Index; Social Science Citation Index; Current Contents. [sl]: ISI, 1994; 22) Kessler, M.M. “Bibliographic Coupling Between Scientific Papers”. American Documentation, 14 (1963): 10-25; 23) Knutson, G. “The year’s Work in Descriptive Cataloging, 1992”. Library Resources and Technical Services, 37 (1993): 263; 24) Lancaster, F.W. “MEDLARS: Report on the Evaluation of its Operation Efficiency”. American Documentation, 20 (1969): 119-142;25) Leonard, L.E. Inter-Indexer Consistency Studies, 1954-1975: A Review of the Literature and Summary of Study Results.[US]: University of Illinois, Graduate School of Library Science, 1977; 26) Library of Congress, Processing Department. Library of Congress Filing Rules. Prepared by J.C. Rather and S.C. Biebel. [us]: Library of Congress, 1980;27) Library of Congress, Subject Cataloging Division. Subject Cataloging Manual: Subject Headings. 4th. ed. [US]:Cataloging Distribution Service, Library of Congress, 1991; 28) Idem. Library of Congress Subject Headings. 16th. ed. [US]: Cataloging Distribution Service. Library of Congress, 1993; 29) LISA: Library and Information Science Abstracts.[England]: Bowker-Saur, 1993; 30) MLA International Bibliography of Books and Articles on the Modern Languages and Literatures. [US]: Modern Language Association of America, 1992; 31) Molto, M; Svenonius, E. “Automatic Recognition of title Page Names”. Information Processing and Management, 27 (1991): 83-95; 32) Mulvany, N.C. Indexing Books.[US]: University of Chicago Press, 1994; 33) National Library of Medicine. Medical Subject Headings. [sl] National Technical Information Service,US Department of Commerce, 1993; 34) Salton, G.; Allan, J. and Buckley, C. “Automatic Structuring and Retrieval of Large Text Files”. Communications of the ACM. Vol. 37, No. 2 (1994): 97-108; 35)Saracevic, T., and [et. al]. “A Study of Information Seeking and Retrieving”. Journal of the American Society for Information Science, 39 (1988): 161-216; 36) Small, H.G. “Co-Citation in the Scientific Literature: a New Measure of the Relationship Between two Documents”. Journal of the American Society for Information Science, 24 (1973): 265-269;37) Soergel, D. Organizing Information: Principles of Database and Retrieval Systems. [sl]: Academic Press, 1985; 38)Sparck- Jones, K., editor. Information Retrieval Experiment. [sl]: Butterworths, 1981; 39) Svenonius, E.,Liu, S. and Subrahmanyam, B. “Automation of Chain Indexing”. in N.J. Williamson and M. Hudon. International Study Conference on Classification Research, 1991, Toronto. Classification Research for Knowledge Representation and Organization, FID 698. [sl]: Elsevier, 1992, PP. 351-364; 40) Weibel, S. “Automated Cataloging: Implication for Libraries and Patrons”. In F.W. Lancaster and L.C. Smith, editors. Artificial Intelligence and Expert Systems: Will they Change the Library?, Clinic on Library Applications of Data Processing (1990, University of Illinois at Urbana – Champaign). Urbana-Champaign: Graduate School of Library and Information Science, University of Illinois, 1992, PP. 67-80; 41) Wellisch, H.”The Cybernetics of Bibliographic Control: Toward a Theory of Document Retrieval Systems”. Journal of the American Society for Information Science, 31 (1980): 41-50; 42) Wilson, P. Two Kinds of Power: An Essay on Bibliographical Control. US: University of California Press, 1968.
ترجمه حميدرضا جمالي مهموئي
[1] . Organization of Knowledge
[2]. بدين معني كه در نمايه انتهاي كتاب ديگر لزومي به توصيف خود سند يعني كتاب و ويژگيهاي ظاهري آن نيست و تنها محتوا توصيف ميشود. مترجم.
[3] . Search thesauri
[4] . Computer algorithm
[5] . Co-occurrence
[6] . Associative interactive dictionary
[7] . Bibliographic coupling
[8] . Co-citation
[9] . Latent semantic analysis
.[10] Expert systems
[11] . Exhaustivity
[12]. Indexing Modules
[13] . Embeded
[14] . String indexing algorithms
[15] . PRECIS (Preserved Context Indexing System)
[16] . KWIC) Key Word in Context(
[17] . KWOC )Key Word out of Context)
[18] . KWAC (Key Word Alongside Context)
[19] . Frame-based prompting systems
[20] . MedIndEx
[21] . Textual databases
[22] . Textbases
[23] . Scope
[24] . Domain
[25] . Potential user
[26] . Document-oriented
[27] . Entity-oriented
[28] . Request-oriented
[29] . Documentary scope
[30] . Non-displayed indexes
[31] . National Information Standards Organization) NISO)
[32] . Analysis base
[33] . Threshold of improtance
[34] . Recall
[35] . Syntax
[36] . Truncation
[37] . Weighted term vectors
[38] . Probabilistic indexing
[39] . Ranked retrieval
[40] . Pre-coordinate
[41] . Post-coordinate
[42] . Ad hoc syntax
[43] . Permuted syntax
[44] . String syntax
[45] . Locator
[46]. مترجم مثالها را تغيير داده است.
[47] . Institute for Scientific Information (ISI(
[48] . Permuted indexes
[49] . Faceted indexing
[50] . Dr. Woolacott
[51] . Nested Phrase Indexing System (NEPHIS)
[52] . Chain indexing
[53] . String indexing
[54] . Specificity
[55] . Search interface
[56] . Surrogation
[57] . Internal links
[58] . Pointers
[59] . Record display
[60] . Alphanumerically
[61] . Relationally
[62] . Characters
[63]. بايد توجه داشت اين توضيح در مورد زبان انگليسي صادق است و در زبان فارسي، فاصله يا جدانويسي مبناي درستي براي تعيين محل كلمات در آرايش كلمه به كلمه نيست به عنوان مثال به كلمه گلآرايي در مثال بعدي توجه كنيد، مثال نويسنده را براي انطباق با زبان فارسي تغيير دادهام. مترجم.
[64] . Extra-alphanumeric
[65] . Facet membership
[66] . Class heading
[67] . Enumerative classification schemes
[68] . Synthetic classification
[69] . Faceted Classification of Library and Information Science
[70] . Menu
[71] . Hypertext displays
[72] . Failure analysis
[73] . James D. Anderson