Doküman Yönetim Sistemi DYS EBYS Analiz Makalesi

Merhabalar,

 

Sizlere bazı bilgiler aktarmak istiyorum, aslında buzdağının altından bir kesit vermeye çalışacağım.

 

İndeksleme ve arama motorları önemli bir bileşen, önemi ise özellikle alt yapının oluşturulması ve geleceğe yönelik mimarisi. Çünkü pek çok arşivde belge sayısı oldukça fazla, özenli ve düzgün bir mimari olmadığında ise telafisi oldukça güç oluyor ve emekler ve para boşa harcanıyor, harcanması bir yana töhmet altında kalınması ve işin sahiplenilmemesi de beraberinde geliyor.

Örneğin karşılaştığımız en ciddi problemlerden birisi metadataların veritabanında tutulması ve esneklikle ilgili problemler ve metaverilerin zaman içerisinde kaybedilmesi riski (bilgi işlem tarafından yapılan çalışmalar esnasında kayıplar oluşabiliyor).

 

Arama motorlarından ülkemizde en çok kullanılan Lucene tabanlı olanlar. Bunlardan bazıları Lucene, SOLR, Elastic Search...

Genelde bu arama motorları Java lisanı kullanılarak geliştirilmiştir. Açık kaynak olmasına karşın bazı sorunlar olduğu bilinmektedir. Bunlar:

1. Tamamen açık kaynak değildir, bazı bileşen ve kitaplıklar ticaridir ve katma değer elde etmek için bu bileşenlere ihtiyaç bulunmaktadır.

2. Yüksek hacimli sayısal arşiv uygulama örnekleri bulunmamaktadır (10-15 milyonu aşan bir örnek uygulama olduğu hiç bir kaynak tarafından teyit edilmemektedir). Bizim karşılaştığımız müşteri problemlerinde ise 2 milyon civarında ciddi performans problemleri olduğu yönündedir.

3. Belgeler manuel olarak indekslemeye tabi tutulmaktadır.

4. İndeks kataloglarında bozulmalar olması halinde yüksek bakım bedelleri gündeme gelebilmektedir (açık kaynak kod sahipleri tarafından).

5.Açık kaynak kodlara karşı değiliz, ancak bu tür açık kaynak kodlara hakim olmayan ve sadece kullanıcı durumunda olan firmaların sorunlarla karşılaşması ve çözüm üretememesi gayet doğaldır.

6. Sezgisel istatiksel arama olanağına sahip değidirler. Sadece klasik "full text" olanağı ile yetinilmek durumundadır.

7. Metadata indekslemesi olanağı yoktur. XMP (Extensible Metadata Platform), yani PDF'e gömülü metadata söz konusu değildir.

8. Kriptolu belgeler indekslenememekte ve aranamamaktadır (Hasta bilgilerinin bir kısmı mahrem nitelikte olabilmektedir).

9. Dokümantasyon eksikliği

10. Backward compatibi