Implementasi Sistem Temu Balik Informasi Pada Pencarian Dokumen Teks Web Berbahasa Indonesia
Teknologi di bidang komputasi dan telekomunikasi membuat informasi dapat di akses dengan cepat dan mudah didapatkan, kemudahan ini menyebabkan informasi menjadi semakin banyak dan beragam. Dengan kemudahan ini belajar akan lebih mudah karena banyaknya informasi yang di akses dan didapatkan dengan mudah. Banyaknya jumlah informasi yang beredar saat ini menimbulkan masalah untuk melakukan pencarian informasi dengan cepat dan akurat untuk menghasilkan dokumen yang relevant dengan pertanyaan pengguna belum sesuai dengan apa yang diinginkan pengguna. Untuk itu dikembangkanlah ilmu yang diberi nama Temu Balik Informasi. Penelitian ini membahas bagaimana menerapkan konsep temu balik informasi pada pencarian dokumen berbasis teks web dengan mengembangkan prototipe simulasi aplikasi sistem temu balik informasi. Konsep temu balik informasi dalam penelitian ini di bagi menjadi 3 proses, yaitu proses pengambilan dan penyimpanan dokumen, proses pengindeksan, dan proses pencarian dokumen. Pada sistem temu balik informasi sebelum dilakukan proses pencarian dilakukan proses pengindeksan. Proses pengindeksan dilakukan untuk membangun indeks keyword. Proses pengindeksan meliputi, proses tokenisasi dan stoplist, pengambilan kata keyword, pembobotan TF-IDF, dan stemming. Selanjutnya dilakukan proses pencarian dokumen dengan menggunakan 4 kata kunci dan menghasilkan nilai rata-rata precision = 0.43368 dengan tingkat kemampuan sistem untuk hanya mengembalikan dokumen yang relevant sebesar 43.368% dan perhitungan rata-rata recall = 1.
Kata Kunci: Temu Balik Informasi, Pengindeksan, Pencarian Dokumen
Technology in the field of computing and telecommunications makes information accessible quickly and easily obtained, this convenience causes information to become more and more diverse. With this ease learning will be easier because of the large amount of information that is accessed and obtained easily. The large amount of information circulating at the moment causes problems to search information quickly and accurately to produce documents that are relevant to the user's question not in accordance with what the user wants. For this reason a science was developed which was named the Information Retrieval. This study discusses how to apply the concept of information retrieval in the search for web-based text documents by developing prototypes of information retrieval system application simulation. The concept of information retrieval in this study is divided into 3 processes, namely the process of document retrieval and storage, the indexing process, and the document search process. In the information retrieval system before the search process is carried out the indexing process is carried out. The indexing process is done to build a keyword index. The indexing process includes, tokenization and stoplist processes, keyword word retrieval, TF-IDF weighting, and stemming. Then the document search process is carried out using 4 keywords and produces an average value of precision = 0.43368 with the level of the system's ability to only return the relevant documents of 43.368% and the calculation of the average recall = 1.
Keywords: Information Retrieval, Indexing, Document Search
