Firma řeší problém, který by v první řadě neměl existovat. Měl by tu být nějaký standard, aby faktury byly strojově čitelné už v základu. Např. XML metadata uvnitř PDF. :-/
Strukturovaný formát ISDOC pro elektronickou fakturaci u nás existuje, je zabudován ve spoustě ERP systémů a úspěšně se užívá min. 10 let, již od dob Kalouska.
Takže na čtení jinak primitivních údajů se dnes používá AI (kdo ví, co to ve skutečnosti je) pro lámání z PDF? Tak to jsme udělali pokrok.
Navrhuju před zpracováním projet PDF alespoň Caesarovou šifrou, ať to není tak jednoduché.