PENGEMBANGAN CHATBOT BERBASIS PDF MENGGUNAKAN LOCAL RETRIEVAL-AUGMENTED GENERATION (RAG) DAN OLLAMA

Authors

  • Gerald Dustin Albert Universitas Singaperbangsa Karawang
  • Apriade Voutama Universitas Singaperbangsa Karawang

DOI:

https://doi.org/10.23960/jitet.v13i2.6361

Abstract Views: 1082 File Views: 888 File Views: 0 File Views: 0

Abstract

Chatbot berbasis PDF dengan pendekatan Local Retrieval-Augmented Generation (RAG) telah dikembangkan untuk meningkatkan aksesibilitas dan efisiensi pencarian informasi dalam dokumen. Penelitian ini bertujuan untuk membangun sistem chatbot yang dapat memahami dan menjawab pertanyaan pengguna berdasarkan isi dokumen PDF secara lokal tanpa bergantung pada layanan cloud. Implementasi sistem ini menggunakan ChromaDB sebagai vector database untuk penyimpanan embedding teks, model embedding nomic_embed_text untuk representasi vektor, serta Ollama sebagai LLM Manager yang mengelola proses inferensi. Metode penelitian yang digunakan adalah Rapid Application Development (RAD), yang terdiri dari tahapan perencanaan, desain, implementasi, dan pengujian. Proses ini memungkinkan pengembangan chatbot secara iteratif dengan penyesuaian cepat terhadap kebutuhan pengguna. Pengujian dilakukan menggunakan metrik ROUGE-L, yang menunjukkan skor sebesar 0,85, menandakan tingkat relevansi jawaban yang cukup tinggi. Meskipun sistem memiliki keunggulan dalam privasi data dan efisiensi pencarian, terdapat keterbatasan dalam dukungan bahasa serta waktu respon yang bervariasi tergantung spesifikasi perangkat. Hasil penelitian ini menunjukkan bahwa chatbot berbasis Local RAG dapat menjadi solusi alternatif yang efisien dalam pencarian informasi berbasis dokumen PDF. Pengembangan lebih lanjut diperlukan untuk meningkatkan kecepatan respon serta mendukung multi-bahasa guna memperluas cakupan penggunaannya.

Downloads

Download data is not yet available.

References

M. F. Allard and A. Voutama, “Rancang Bangun Sistem Informasi Reservasi Hotel ‘Hotel Hebat’ Berbasis Website,” J. Inform. dan Tek. Elektro Terap., vol. 12, no. 2, 2024, doi: 10.23960/jitet.v12i2.4224.

T. N. Muthmainnah and A. Voutama, “Volume 6 ; Nomor 2,” Juli, vol. 6, pp. 463–471, 2023, [Online]. Available: https://ojs.trigunadharma.ac.id/index.php/jsk/index

T. B. Brown et al., “Language models are few-shot learners -- special version,” Conf. Neural Inf. Process. Syst. (NeurIPS 2020), no. NeurIPS, pp. 1–25, 2020.

M. Raeini and D. Ph, “Privacy-Preserving Large Language Models ( PPLLMs ),” pp. 1–16.

A. Zürcher and A. Zürcher, “Developing a Chatbot for Internal Documents Author”.

H. Xu et al., “Large Language Models for Cyber Security: A Systematic Literature Review,” 2024, doi: 10.1145/3695988.

A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 2017-Decem, no. Nips, pp. 5999–6009, 2017.

P. Lewis et al., “Retrieval-augmented generation for knowledge-intensive NLP tasks,” Adv. Neural Inf. Process. Syst., vol. 2020-Decem, no. NeurIPS, 2020.

“A Comprehensive Survey of Retrieval-Augmented Generation (RAG): Evolution, Current Landscape and Future Directions,” no. Ml.

T. Taipalus, “Vector database management systems: Fundamental concepts, use-cases, and current challenges,” Cogn. Syst. Res., vol. 85, no. January, p. 101216, 2024, doi: 10.1016/j.cogsys.2024.101216.

R. Peng, K. Liu, P. Yang, Z. Yuan, and S. Li, “Embedding-based Retrieval with LLM for Effective Agriculture Information Extracting from Unstructured Data,” no. 2018, p. 2627, 2023, [Online]. Available: http://arxiv.org/abs/2308.03107

Z. Nussbaum, J. X. Morris, B. Duderstadt, and A. Mulyar, “Nomic Embed: Training a Reproducible Long Context Text Embedder,” vol. 002, pp. 1–17, 2024, [Online]. Available: http://arxiv.org/abs/2402.01613

P. Lewis et al., “Retrieval-augmented generation for knowledge-intensive NLP tasks,” Adv. Neural Inf. Process. Syst., vol. 2020-Decem, 2020.

E. Haaralahti, “Utilization of local large language models for business applications,” 2024.

S. Mercer, S. Spillard, and D. P. Martin, “Brief analysis of DeepSeek R1 and its implications for Generative AI,” pp. 1–9, 2025, [Online]. Available: http://arxiv.org/abs/2502.02523

J. B. Gruber and M. Weber, “rollama: An R package for using generative large language models through Ollama,” no. April, 2024, doi: 10.48550/arXiv.2404.07654.

Downloads

Published

2025-04-10

How to Cite

Albert, G. D., & Voutama, A. (2025). PENGEMBANGAN CHATBOT BERBASIS PDF MENGGUNAKAN LOCAL RETRIEVAL-AUGMENTED GENERATION (RAG) DAN OLLAMA. Jurnal Informatika Dan Teknik Elektro Terapan, 13(2). https://doi.org/10.23960/jitet.v13i2.6361

Issue

Section

Articles

Most read articles by the same author(s)

1 2 3 > >>