Nu lăsați fluxurile de lucru să vă încetinească! Instrumentele noastre dezvoltate de sinele nostru - stimulează eficiența de aproape 10 ori
Fundal de dezvoltare: provenind din nevoile reale de producție
Procesarea documentelor pre Press pentru imprimarea digitală durează prea mult timp. După comunicarea cu operatorii de prim rang, au fost identificate și confirmate trei cerințe de bază.
(1) Numerele paginii documentelor de verificare a lotului: În imprimare și tipărire, este adesea necesar să se asigure că numerele de pagini de documente sunt uniforme, altfel poate duce la pierderi de materiale de imprimare sau erori de legare.
)
(3) Verificarea lotului pentru inflexiunea textului: pentru a evita erorile de imprimare cauzate de fonturile lipsă, este necesar să se confirme dacă textul din document a fost transformat în curbe (adică „inflexiune”).
Prin cercetarea Adobe Acrobat și diverse pluginuri de procesare a PDF pe piață, s -a constatat că instrumentele existente au fie funcții redundante și complexe, fie nu corespund procesului de producție real al companiei, în special în ceea ce privește riscurile de securitate în convertirea fișierelor. Mai important, instrumentele similare produse pe plan intern necesită adesea plata, ceea ce duce la costuri de utilizare a termenului -}. Pe baza problemelor practice menționate anterior, compania a decis să dezvolte un instrument specializat ușor, precis și compatibil intern.
Instrument de verificare și procesare a paginilor PDF
01
Funcții de bază și logică de judecată
Scopul principal al acestui instrument este de a se asigura că toate paginile documentului care urmează să fie tipărite sunt uniforme, iar abordarea de judecată și execuție este următoarea.
(1) Mecanism de detectare a paginilor: Citiți metadatele documentelor PDF prin biblioteca PIMUPDF pentru a obține direct informațiile despre pagina totală.
(2) Logica de judecată a parității: Utilizați funcționarea modulului (numărul paginii% 2) pentru a determina paritatea. Dacă rezultatul este 1, acesta este considerat ca o pagină ciudată, iar dacă rezultatul este 0, este considerat ca o pagină uniformă.
(3) Strategia de procesare a diferențierii: dacă este un document cu numeroase impare, adăugați automat o pagină goală de aceeași dimensiune ca documentul original la sfârșitul documentului; Dacă este un document de pagină uniform, păstrați conținutul neschimbat și copiați -l direct în directorul de ieșire.
(4) Principiul procesării securității: Toate documentele procesate sunt salvate în directorul „Fișiere procesate” desemnate, iar fișierele originale rămân neschimbate pentru a evita daunele fișierelor cauzate de misoperare, așa cum se arată în figura 1.
Figura 1 Interfața instrumentului de verificare și procesare a paginii PDF
02
Puncte cheie ale implementării tehnice
Instrumentul folosește TKinter pentru a construi o interfață grafică, care include în principal trei module funcționale.
(1) Modul de selecție a directorului: acceptă selecția vizuală a directoarelor de fișiere sursă și a directoarelor de ieșire, directorul de ieșire implicit fiind subfoldere sub directorul sursă.
(2) Modul de procesare a lotului: folosind tehnologie filetată multi - pentru a implementa procesarea backend, evitarea decalajului de interfață și afișarea progresului de procesare în timpul real - printr -o bară de progres.
(3) Modul de afișare a rezultatelor: Prezentați rezultatele procesării fiecărui fișier într -un format de tabel, inclusiv numărul de pagină original, acțiunile de procesare și informațiile de stare și distingeți între stările de succes și eșuate după culoare.
Instrument de verificare a conversiei PDF
01
Funcții de bază și logică de judecată
Instrumentul de verificare a curbei se concentrează pe determinarea dacă textul din document a fost transformat într -o curbă, iar logica sa de judecată principală se bazează pe analiza informațiilor despre font în documentele PDF.
(1) Detectarea prezenței textului: folosind funcția de extracție a textului paginii, determinați dacă documentul conține text editabil.
(2) Analiza informațiilor împotriva fontului: Analizați lista de fonturi încorporate în document. Dacă există informații despre font, indică faptul că textul nu a fost convertit.
(3) Regula de judecată cuprinzătoare: Dacă există conținut de text, dar nu există informații despre font, indică faptul că melodia a fost convertită (marcată în verde); Fără conținut de text, care nu indică nu este nevoie să comutați piese (etichetă verde); Dacă există conținut de text și informații despre font, indică faptul că melodia nu a fost convertită (marcată în roșu), așa cum se arată în figura 2.
Instrumentul este special conceput pentru modul „Verificare fără conversie”, în principal pentru că, în funcție de feedback -ul operatorilor, atunci când efectuați operația de conversie pe fișiere care conțin sigilii oficiale, este ușor să provocați pierderea sigiliilor oficiale și a altor modele. Prin urmare, numai funcția de verificare este păstrată.
Figura 2 Instrument de verificare a conversiei PDF
02
Puncte cheie ale implementării tehnice
Acest instrument folosește, de asemenea, TKinter pentru a construi interfața, iar punctele tehnice cheie includ următoarele trei puncte.
(1) Extracția informațiilor împotriva fontului: Utilizarea funcției de analiză a blocului de text Pymupdf, obțineți numele și aparițiile tuturor fonturilor utilizate în document.
(2) Vizualizarea rezultatelor: utilizați o vedere a arborelui pentru a afișa rezultatele inspecției și distingeți vizual diferite stări prin culori și pictograme.
(3) Funcția de statut de stare: Calculați automat numărul de fișiere care îndeplinesc cerințele, ajutând operatorii să înțeleagă rapid situația generală de inspecție.
Dificultăți și soluții în procesul de dezvoltare
În calitate de dezvoltator non -profesionist, am întâmpinat multe provocări tehnice în timpul procesului de dezvoltare a instrumentelor. Problemele și soluțiile specifice sunt următoarele.
(1) Problema de adâncime de analiză PDF: Biblioteca inițială PDF utilizată nu a putut extrage cu exactitate informațiile despre fonturi. După recomandarea AI, aceasta a fost rezolvată prin înlocuirea acesteia cu biblioteca PIMUPDF.
(2) Problema interfeței de decalaj: La procesarea unui număr mare de fișiere în vrac, interfața este predispusă la stări fără răspuns. Cu îndrumarea AI, o soluție multi - a fost implementată pentru a rezolva eficient această problemă.
(3) Caracterele chinezești afișate: Prin configurarea parametrilor fontului și codificarea setărilor, a fost rezolvată problema caracterelor chinezești afișate în interfață și a fișierelor exportate.
(4) Mecanismul de gestionare a excepțiilor: Ca răspuns la problema prăbușirilor de programe cauzate de fișierele PDF deteriorate, un mecanism de captare de excepție a fost îmbunătățit pentru a se asigura că eșecul procesării individuale a fișierelor nu afectează procesul general.
Pe parcursul procesului de dezvoltare, instrumentele AI au jucat un rol important în calitate de consultanți tehnici, oferind nu numai exemple cheie de cod, ci și explicând principiile analizării formatului de fișiere PDF, ajutând dezvoltatorii să înțeleagă rapid cunoștințele profesionale de domeniu.
Valoarea și perspectiva aplicației de instrumente
Aplicarea acestor două instrumente a adus îmbunătățiri semnificative ale eficienței lucrărilor de producție, care se reflectă în următoarele două aspecte.
(1) Economii de costuri de timp: Lucrările de inspecție manuală care a cerut inițial 1 oră poate fi finalizată acum în 5 minute, crescând eficiența de aproape 10 ori.
(2) Stabilitatea îmbunătățită a calității: evitarea eficientă a omisiunilor de inspecție manuală și asigurarea calității imprimării stabile.
Înregistrarea procesului de dezvoltare a acestor două instrumente mici își propune să transmită filozofia de lucru a „explorării și inovației”, se concentrează pe rezolvarea problemelor specifice în producția reală, optimizarea fluxurilor de lucru tradiționale prin mijloace tehnologice și, în final, atinge obiectivul reducerii costurilor și îmbunătățirea eficienței.

