
    SSi\                     .    d dl Z dedeeee   ef   fdZy)    N	file_pathreturnc                 l   g }t         j                  j                  |       sddgdfS 	 t        | ddd      5 }|j	                         }ddd       t        j                               }|dk(  rddgdfS |dk  r|j                  d       d||fS d||fS # 1 sw Y   MxY w# t
        $ r	 d	d
gdfcY S w xY w)z
    MVP de OCR/legibilidade:
    - verifica se o ficheiro existe
    - tenta ler texto simples
    - score baseado em tamanho do texto
    g        u   Ficheiro não encontrado rzutf-8ignore)encodingerrorsNg?u"   Não foi possível ler o documentor   g?u   Documento sem texto legível   u/   Texto muito curto, possível baixa legibilidadeg      ?g?)	ospathexistsopenread	Exceptionlenstripappend)r   	problemasftexttext_lens        RC:\Users\dkayr\PycharmProjects\Credit_Scoring_plataform\src\infra\documents\ocr.pyanalyze_legibilityr      s     I77>>)$/0"44?)S78D668D E
 4::< H1}34b88#~JKIt##	4 ED ?9:B>>?s(   B! B	B! BB! !B32B3)r   strtuplefloatlistr        r   <module>r!      s+    	 #  %tCy#0E*F  r    