Konuyu Oyla:
  • Derecelendirme: 5/5 - 1 oy
  • 1
  • 2
  • 3
  • 4
  • 5
pdf dosyasından metin bulup almak
#1
merhaba;
delphi den pdf dosyasını okuyup içindeki herhangi bir metni bulup almak.

örneğin : E-Fatura pdf dosyasında Fatura No : 0001 gibi bir bilgiden Fatura No araması yaparak 0001 bilgisini almak istiyorum.

bunun gibi birden fazla bilgiyi okuyup almak. bu işlem için nasıl bir yol izleyebiliriz. bu işlemi yapabileceğimiz bir component varmıdır.

Teşekkür ederim.
Cevapla
#2
(27-11-2020, Saat: 15:41)akuyumcu63 Adlı Kullanıcıdan Alıntı: merhaba;
delphi den pdf dosyasını okuyup içindeki herhangi bir metni bulup almak.

örneğin : E-Fatura pdf dosyasında Fatura No : 0001 gibi bir bilgiden Fatura No araması yaparak 0001 bilgisini almak istiyorum.

bunun gibi birden fazla bilgiyi okuyup almak. bu işlem için nasıl bir yol izleyebiliriz. bu işlemi yapabileceğimiz bir component varmıdır.

Teşekkür ederim.

Merhaba,

Bunun için ocr componentleri var, fakat belirli bir standart olmayacağını düşünüyorum.

Eğer siz e fatura için bunu yapacaksanız entegratör firmanız zaten gelen faturayı field field alabileceğiniz şekilde size verir, böylelikle sorunsuz çözüm sağlamış olursunuz.

İyi çalışmalar.
Cevapla
#3
Merhaba.
@pro_imaj katılıyorum, direkt siz yapacaksanız çok farklı türde PDF tipi var. İçindeki metni direkt okuyabildiğimiz PDF/A tipleri olduğu gibi çok sıkıştırma uygulanmış, metne direkt erişemediğimiz olanlar var. Hatta içeriğin tümü fotoğraflanmış olan da.


* Sizin için araştırdım, çok güzel (OpenSource) bir proje buldum. Bu linkten ulaşabileceğiniz XpdfReader isminde bir çok command line tool içeren (kurulum gerekmez, komut satırı uygulamalarıdır).

* Bilgisayarınıza bir kurulum gerekmez, verdiğim linkteki Download the Xpdf command line tools:kısmındaki ZIP paketi indirin. İçerik aşağıdaki gibi. 

* Bir fatura örneğim ile denedim sonuç başarılı. pdftotext fatura.pdf şeklinde komutu satırı yeterli. Hemen txt haline dönüştürdü. İçeriği de okunabilir nitelikte. 

wxaj1qegt94aohz2bybi.png
Saygılarımla
Muharrem ARMAN

guplouajuixjzfm15eqb.gif
Cevapla
#4
Bugün aklıma bir şey geldi. Bir deneyeyim dedim. 
Sonuç başarılı.  Idea

* Biraz karmaşık bir yöntem sayılır, şu şekilde :

  1. PDF dosya Google Drive'a kopyalanıyor.
  2. Oradan Google Docs'a kopyalanıyor.
  3. Oradan TEXT olarak EXPORT ediliyor.
* Bu üç aşama için önce API'ler devreye sokulması gerekiyor. 


jvjre4jerb9bjnrb14ql.png

  // (1)  https://console.cloud.google.com/iam-adm...ceaccounts linkine gidilir
  // (2)  Poje seçilir
  // (3) "App Engine default service account" varsa, etiketin sonunda  üç nokta üst üste menü tıklayıp "Anahtar Oluştur" seçer seçmez download başlar...
  // (4)  JSON dosya "type": "service_account" dur.

* Bu dosya içerisindeki KEY ile OAuth2 Authorization yapabiliyor olmak bu altyapıyı kullanabilmek için ilk şart.

* Gerisi https://developers.google.com/drive/ api'sinden yürüyor.  

* Burada şu aşamada kod paylaşımı yapamayacağım. Sadece böyle bir yöntemin sonuç verdiğini duyurmak için yazıyorum.
 

ggsatois393nckzroepx.gif

o3ooltjxgwof8drkekj1.gif
Saygılarımla
Muharrem ARMAN

guplouajuixjzfm15eqb.gif
Cevapla
#5
Elinize emeğinize sağlık. Yine çok güzel bir çalışma olmuş.
Cevapla
#6
Heart 
(29-11-2020, Saat: 22:15)mrmarman Adlı Kullanıcıdan Alıntı:
  1. PDF dosya Google Drive'a kopyalanıyor.
  2. Oradan Google Docs'a kopyalanıyor.
  3. Oradan TEXT olarak EXPORT ediliyor.
Vay anasının elini öpüp başıma koyuyum ya... Farkında olmadan çok büyük yardım ettin abi... Teknik resim dosyalarını bu taktikle her makinenin üstünde bi ekranda gösterilebilir... Böylelikle gereksiz kağıt -ağaç- israfı önlenebilir... Doğa dostu @mrmarman hocam...
not: Yönetimden 100 ve üzeri rep verebilmeyi talep ediyorum Smile .
Cevapla
#7
değerli dostlar ilgi ve alakanızdan dolayı çok teşekkür ederim.
e faturanın pdf dosyasıyla birlikte xml dosyası da beraberinde geliyormuş. pdf ile verimli olmayacağına karar verdik. xml dosyasından verileri okuyacağız. bu şekilde hatasız işlem yapılacağı kanaatindeyim.

Muharrem hocam faydalı bilgileriniz için ayrıca Teşekkür ederim.
Cevapla
#8
Üstadım bizim de ufkumuzu genişletiyorsunuz, teşekkürler.
Saygılarımla
Muharrem ARMAN

guplouajuixjzfm15eqb.gif
Cevapla


Konu ile Alakalı Benzer Konular
Konular Yazar Yorumlar Okunma Son Yorum
  bir resimden renk kodunu $00584827 seklinde almak sadikacar60 2 658 01-10-2024, Saat: 13:02
Son Yorum: frmman
  PDF dosyasından veri almak Mikdad 11 1.843 07-09-2024, Saat: 10:51
Son Yorum: mrmarman
  SQL' de Değişimde Toplam Almak OZCANK 5 1.745 11-05-2024, Saat: 11:30
Son Yorum: OZCANK
  Donanım bilgilerini almak için geliştirilmiş güzel bir proje burakb44 2 943 02-04-2024, Saat: 16:06
Son Yorum: burakb44
  Delphi Sürekli Adı Değişen Excel Dosyasından Veri Çekme bünyamin68 2 1.387 05-10-2023, Saat: 12:50
Son Yorum: mcuyan



Konuyu Okuyanlar: 1 Ziyaretçi