Microsoft Edge Introduceert OCR voor PDF's: Een Nieuwe Standaard voor Tekstextractie
Microsoft Edge Introduceert OCR voor PDF's: Een Nieuwe Standaard voor Tekstextractie
Microsoft Edge blijft zich voortdurend verbeteren, en we hebben een spannende nieuwe functie ontdekt die momenteel intern wordt getest. Deze functie, genaamd "OCR voor PDF", belooft een revolutie teweeg te brengen in de manier waarop gebruikers teksten uit gescande documenten en afbeeldingen kunnen extraheren.
Momenteel, wanneer je een gescande PDF opent, die feitelijk uit afbeeldingen bestaat, is het onmogelijk om tekst te selecteren, kopiëren of doorzoeken. Dit vormt een aanzienlijke uitdaging voor gebruikers die afhankelijk zijn van de inhoud van deze documenten. Vaak zijn we genoodzaakt om gebruik te maken van interne tools of onhandige online diensten om tekst te extraheren, wat een frustrerende ervaring kan zijn. Maar dat zou binnenkort tot het verleden behoren.
Windows Latest heeft een nieuwe experimentele functie in Edge ontdekt die OCR (Optical Character Recognition) toevoegt aan de PDF-lezer. Voor degenen die het niet weten: OCR staat voor optische tekenherkenning. Tijdens onze tests stuitte Windows Latest op een vlag in Microsoft Edge met de naam "msPdfWindowsOcrCoverage". Dit lijkt te wijzen op het gebruik van een ingebouwde OCR-engine om tekst uit afbeeldingen te extraheren.
We hebben het hier over de ingebouwde OCR van Windows 11, die oorspronkelijk met Windows 10 werd geïntroduceerd als onderdeel van het Universal Windows Platform (UWP). Dit stelt applicaties in staat om de OCR-engine te gebruiken voor het extraheren van tekst en lay-outinformatie. Hoewel Microsoft nog niet officieel heeft bevestigd dat het werkt aan de integratie van Windows OCR in de PDF-lezer van Edge, heeft een van onze bronnen ons verteld dat de OCR-engine van Windows 11 bijzonder goed is in het detecteren van tekst in verschillende soorten afbeeldingen, waaronder gescande documenten en gewone foto's.
Een belangrijk voordeel van Windows 11's OCR is dat het lokaal draait. Dit betekent dat je gegevens niet naar Microsoft worden verzonden en dat er geen internetverbinding nodig is om de functie te gebruiken. Bovendien ondersteunt de OCR tot wel 25 talen, wat de toegankelijkheid verder vergroot.
Populaire applicaties zoals Word, OneNote, Bing en OneDrive maken al jaren gebruik van de Windows OCR API, en nu lijkt het erop dat deze functionaliteit eindelijk naar Microsoft Edge komt. Het doel van deze ontwikkeling is om PDF-documenten nuttiger te maken door gebruikers in staat te stellen tekst te kopiëren of de toegankelijkheid te verbeteren.
Aangezien het om een experimentele functie gaat, is het nog niet voor iedereen beschikbaar. Geïnteresseerden kunnen de functie echter uitproberen door naar de Edge-instellingen te navigeren via edge://flags, de vlag in te schakelen en de browser opnieuw op te starten. Dit zou Edge in staat moeten stellen om beter om te gaan met niet-doorzoekbare PDF's.
Hoewel het nog onduidelijk is wanneer de OCR-ondersteuning voor PDF's beschikbaar zal zijn in Microsoft Edge, is dit niet de enige verbetering die op komst is. Eerder meldde Windows Latest dat Microsoft ook werkt aan het versnellen van de Edge-browser. Volgens onze bevindingen zal het downloadmenu, het extensiemenu, de geschiedenis-tab, het drie-punt-menu en zelfs de "Vraag Copilot" of rechtermuisklikmenu aanzienlijk sneller worden.
Met deze aankomende functies lijkt Microsoft Edge niet alleen een krachtigere PDF-lezer te worden, maar ook een algehele verbeterde browser-ervaring te bieden. Het is een spannende tijd voor Edge-gebruikers, en we kijken uit naar de verdere ontwikkelingen die deze browser naar nieuwe hoogten zullen tillen.
Aanbevolen reactie
Doe je mee?
Je kunt nu een bericht plaatsen en je later registeren. Als je al een account hebt, kun je je hier aanmelden.
Note: Your post will require moderator approval before it will be visible.