PDF-tarkistin

Onko PDF:ni skannattu vai haettava?

Kaikille, jotka eivät saa kopioitua tekstiä PDF:stä ja haluavat tietää miksi.

Pudota PDF ja näe heti, ovatko sen sivut oikeaa, valittavaa tekstiä vai pelkkiä skannattuja kuvia. Tarkistus tapahtuu kokonaan selaimessasi — tiedostoa ei koskaan ladata palvelimelle.

Näin tarkistus toimii

Mitä tämä PDF-tarkistin oikeastaan tekee

01

Avaa PDF selaimessasi

Pudota PDF laatikkoon tai valitse tiedosto. Se luetaan sivulla sisäänrakennetulla PDF-lukijalla, eikä sitä koskaan lähetetä palvelimelle.

02

Lue jokaisen sivun tekstikerros

Tarkistin etsii valittavaa tekstiä jokaiselta sivulta. Digitaalisilla sivuilla on oikeita merkkejä; skannatuilla sivuilla niitä ei ole lainkaan.

03

Saat selkeän tuloksen

Saat tietää, onko PDF haettava, skannattu vai sekamuotoinen — ja mitä se tarkoittaa taulukoiden siirtämiselle Exceliin.

Mitä tulos tarkoittaa

Haettava, skannattu vai sekamuotoinen?

Haettava PDF

Teksti on oikeaa ja valittavaa. Voit kopioida sen, mutta kopiointi ja liittäminen litistää taulukon yleensä yhdeksi sarakkeeksi, koska PDF tallentaa sijoitellun tekstin, ei soluja. Poimi taulukko rakenteineen, jotta rivit ja sarakkeet säilyvät.

Skannattu PDF

Sivu on kuva, joten kopioitavaa tekstiä ei ole lainkaan. Taulukoiden saaminen ulos vaatii OCR:n, joka rakentaa rivit ja sarakkeet uudelleen kuvasta — juuri se tehtävä, jota varten Image to Excel -laajennus on tehty.

Sekamuotoinen PDF

Osa sivuista on digitaalisia ja osa skannattuja liitteitä. Tarkistin kertoo, kuinka monella sivulla on valittavaa tekstiä, joten tiedät, mitkä sivut tarvitsevat OCR:ää.

Seuraava vaihe

Kun tiedät tuloksen, muunna taulukot laskentataulukoksi.

Olipa PDF skannattu tai haettava, taulukko on edelleen lukittuna sivulle. Image to Excel -Chrome-laajennus lukee taulukot PDF:istä, skannauksista, kuvakaappauksista ja kuvista, antaa sinun tarkistaa tuloksen ja vie siistin XLSX- tai CSV-tiedoston — suoraan avoimesta välilehdestä.

UKK

Kysymyksiä skannatusta ja haettavasta PDF:stä

Miten tunnistan, onko PDF skannattu vai haettava?

Yritä valita tekstiä PDF:stä. Jos voit korostaa sanoja, kyseessä on haettava digitaalinen PDF. Jos mikään ei korostu, sivu on kuva ja PDF on skannattu. Tämä tarkistin lukee jokaisen sivun tekstikerroksen ja kertoo vastauksen puolestasi.

Ladataanko PDF:ni minnekään?

Ei. Tarkistus tapahtuu kokonaan selaimessasi sisäänrakennetulla PDF-lukijalla. Tiedostoa ei koskaan lähetetä palvelimelle.

PDF:ni on skannattu — miten saan taulukot Exceliin?

Skannatut sivut ovat kuvia, joten tarvitset OCR:n, joka rakentaa rivit ja sarakkeet uudelleen kuvasta. Image to Excel -Chrome-laajennus lukee taulukot skannatuista PDF:istä ja kuvista ja vie XLSX:n tai CSV:n nopean tarkistuksen jälkeen.

Miksi kopiointi haettavasta PDF:stä hukkaa taulukon sarakkeet?

PDF tallentaa sijoiteltuja tekstinpätkiä, ei oikeita soluja, joten kopiointi litistää taulukon yleensä yhdeksi yhteen sulautuneeksi sarakkeeksi. Jotta rivit ja sarakkeet säilyvät, poimi taulukko rakenteineen sen sijaan, että kopioit raakatekstin.

Voiko PDF olla osittain skannattu ja osittain haettava?

Kyllä. Monissa asiakirjoissa digitaaliset sivut yhdistyvät skannattuihin liitteisiin. Tarkistin kertoo, kuinka monella tarkistetuista sivuista on valittavaa tekstiä, joten tiedät, mitkä sivut tarvitsevat OCR:ää.