Google rozwiewa wątpliwości co do indeksowania PDF-ów w wyszukiwarce - Webhosting.pl. Portal technologii internetowych.pdf
(
706 KB
)
Pobierz
705051162 UNPDF
Webhosting.pl
WindowsHosting.pl
Forum
E-wydania
Kontakt
RSS
login
●●●●●
Zaloguj się
Zarejestruj się
Po co mi konto?
Magazyn
Testy
Praktyka
Wideo
Społeczność
Po godzinach
WindowsHosting.pl
Domeny
Serwery
Programowanie
Biznes
Marketing
Bezpieczeństwo
Internet
Software
Szukaj
publikuj:
wydrukuj
1
skomentuj »
TAGI:
google
,
pdf
,
wyszukiwarka
,
indeks
+
wykop
2011-09-05 12:00 | Adam Golański
Google rozwiewa wątpliwości co do indeksowania
PDF-ów w wyszukiwarce
Choć wiele uczyniono na drodze do tego, żeby PDF-y stały się uniwersalnym i łatwym w obsłudze
formatem rozpowszechniania dokumentów, wciąż treści zapisane w formacie od Adobe'a nie są równie łatwe
do odczytania i znalezienia, jak te, które zapisano w HTML. Wyświetlenie staje się prostsze, odkąd w
Chrome wbudowano czytnik tego formatu (niebawem javascriptowy czytnik PDF pojawić się ma też w
Firefoksie) – a jak wygląda kwestia indeksowania i wyszukiwania takich treści? Google postanowiło wyjaśnić
dokładnie tę kwestię.
Na łamach bloga Webmaster Central pojawił się zbiór pytań i odpowiedzi, które wyjaśniają, co dzieje się z
dokumentami PDF, do których dobrały się roboty wyszukiwarki Google'a. Roboty te PDF-ami żywią się już
od 10 lat, od tamtego czasu pochłonęły setki milionów dokumentów. Typ pliku im bowiem nie przeszkadza.
„Nasze algorytmy nie dają się spowolnić różnym typom plików. Ciężko pracujemy nad wydobyciem
odpowiednich treści i właściwym ich zindeksowaniu dla naszej wyszukiwarki” – napisał Gary Ilyes, analityk
Google'a.
Ilyes wyjaśnia, że obecnie Google pozyskuje wszelki tekst z PDF-ów (o ile nie są zabezpieczone hasłem).
Jeśli PDF to po prostu skany tekstu, wyszukiwarka wykorzystuje swój engine OCR, starając się
przekształcić go do tekstowej postaci.
Jeśli jednak w PDF-ie znajdą się obrazki, to nie zostaną zindeksowane. Webmasterzy, którzy chcieliby, by
grafiki takie znalazły się w indeksie Google'a, powinni umieścić je normalnie na swoich witrynach. Z kolei
hiperlinki w PDF-ach są traktowane tak samo, jak hiperlinki w dokumentach HTML, co więcej, wliczają się
do rankingu pozycji strony.
Skoro już mowa o rankingu, to dokumenty w PDF, jeśli są relewantne do zapytania, mogą uzyskać bardzo
wysoką pozycję, nawet zająć pierwsze miejsce. Warto jednak przy tym zadbać o to, by nie stanowiły one
duplikatu treści zapisanych w HTML, ustalając
kanoniczność
strony w HTML, lub w nagłówkach HTTP
zasobu w PDF.
Aby zadbać zaś o sposób prezentacji dokumentu PDF w ywszukiwarce, trzeba przyjrzeć się dwóm
kwestiom – metadanym w pliku i opisom kotwic wskazujących na URL danego PDF-u. Na ich bowiem
podstawie algorytmy Google'a generują tytuł dokumentu wyświetlany w liście wyników.
Na koniec warto pamiętać, że aby zabronić robotom indeksowania plików PDF na witrynie, należy dodać do
nagłówka strony serwującej te dokumenty znacznik "X-Robots-Tag: noindex". Więcej dowiecie się z uwag
Matta Cuttsa w poniższym wideo, przedstawiającego najlepsze praktyki dla optymalizacji PDF-ów.
googlewebmastercentral.blogspot.com
Podoba Ci się ten tekst? Powiedz o tym innym na Fb:
Lubię to!
24
lub na G+:
1
publikuj:
wydrukuj
1
skomentuj »
Polecamy
Reklamy
Kup swoją reklamę na Webhosting.pl!
Warto przeczytać
Czy blokowanie komentarzy w Google+ przekona szefów Google'a do korzystania ze
swojego produktu?
skomentuj »
Statystyki Google Analytics w czasie rzeczywistym – to jest to!
skomentuj »
Chrome na Androida pojawić się może już w październiku, dorówna w możliwościach
wersji desktopowej
12
skomentuj »
Google udostępniło swój framework testów jednostkowych JavaScriptu
skomentuj »
Komentarze
#1
KOREKTOR
2011-09-06 20:58:31 0
ywszukiwarce
Aby zadbać zaś o sposób prezentacji dokumentu PDF w ywszukiwarce, trzeba przyjrzeć się
dwóm kwestiom – metadanym w pliku i opisom kotwic wskazujących na URL danego PDF-u.
Na ich bowiem podstawie algorytmy Google'a generują tytuł dokumentu wyświetlany w liście
wyników.
IP: 89.229.71.[...] Mozilla/5.0 (Windows NT 5.1) AppleWebKit/535.1 (KHTML, like Gecko)
Chrome/13.0.782.220 Safari/535.1
*Autor:
*Komentarz:
Odśwież
*Przepisz słowa
Uwaga! Możesz
zarejestrować się
w serwisie i w ten sposób zarezerwować swój nick oraz ominąć
konieczność ciągłego odczytywania wyrazów.
Wyślij
Aby dodać komentarz, musisz podać swój nick, treść komentarza oraz poprawnie przepisać oba słowa
z obrazka (słowa muszą być rozdzielone spacją).
W treści komentarza można używać języka formatowania
BBcode
.
Plik z chomika:
Programowanie2018
Inne pliki z tego folderu:
SEO SearchTerms Tagging 2 - blog e-biznes.pdf
(479 KB)
netmailer10.mp4
(61118 KB)
Pozycjonowanie-Krzywarączka_2011-09-05(2).mp4
(31684 KB)
Tajemnice_pozycjonowania_2012.02.01.mp4
(28916 KB)
Pozycjonowanie-Krzywarączka_2011-09-05(1).mp4
(31684 KB)
Inne foldery tego chomika:
!!! MUZYKA POLSKA
#___# POLSKIE HITY Mp3
▣ BBC ŻYCIE SSAKÓW
◄BAJKI i BAŚNIE►
♦E-booki - Literatura
Zgłoś jeśli
naruszono regulamin