31Aug
Jeśli twoja reakcja na ogłoszoną śmierć Google Reader brzmiałaby "Ale moje ulubione rzeczy !", To jest tutorial dla ciebie. Czytaj dalej, ponieważ pokazujemy różne sposoby wyodrębniania wszystkich artykułów oznaczonych gwiazdką z Czytnika Google.
Dlaczego chcę to zrobić?
Google Reader wyłącza się 1 lipca. Jeśli ty, podobnie jak miliony fanów RSS na całym świecie, jesteś fanem Czytnika Google, istnieje duża szansa, że użyłeś funkcji gwiazdy do oznaczania artykułów do przetrzymywania, czytania później lub do jakiegoś innego celu.
Jeśli chcesz mieć pewność, że wszystkie te artykuły oznaczone gwiazdką są bezpieczne i bezpieczne pomimo zbliżającej się implozji Google Reader, musisz wykonać kilka drobnych czynności, aby upewnić się, że masz dane w posiadaniu i nie zostawiasz ich do zgniotu.serwery Google.
Po zakończeniu samouczka będziesz mieć( przynajmniej) plik, który zawiera wszystkie elementy oznaczone gwiazdką oraz( w zależności od tego, z którego segmentu samouczek zdecydujesz się podążać) elementy oznaczone gwiazdką w większej liczbie użytkownikówprzyjazny format.
Jest jednak jedna rzecz, z której nie może skorzystać żaden magia wywozu lub automatyzacji, a to faktycznie przetwarza treść artykułów oznaczonych gwiazdką.Jeśli publikujesz artykuły, które będą czytać później przez lata, prawdopodobnie zdziwisz się, ile wyeksportowanych artykułów generuje ten proces. Być może będziesz musiał odłożyć na bok trochę czasu każdego dnia na kilka tygodni, aby przeglądać wynikowy zrzut bit po bicie.
Eksportowanie danych Google Reader z Google Takeout
Pierwszym zadaniem jest po prostu otrzymanie kopii wszystkich danych czytnika Google bezpośrednio w Twoim posiadaniu. W ten sposób, bez względu na to, co stanie się z Twoimi danymi z Czytnika na serwerach Google w przyszłości, będziesz mieć kopię do pracy.
Google Takeout to świetne narzędzie do wydobywania danych ze wszystkich usług Google, ale interesuje nas tylko Czytnik dla tego samouczka. Odwiedź podsekcję Czytnik narzędzia Google Takeout tutaj. Obliczenie rozmiaru pliku Takeout zajmie chwilę.Po zakończeniu kliknij Utwórz archiwum.
Mimo że nie eksportuje całego konta Google, ale tylko niewielką jego część, proces ten zajmuje zaskakująco dużo czasu. Zalecamy sprawdzenie opcji "Wyślij do mnie e-maila, gdy wszystko będzie gotowe" i zabranie filiżanki kawy.
Po zakończeniu kliknij przycisk Pobierz, który pojawi się w prawym dolnym rogu.
Śmiało i wyodrębnij archiwum do katalogu roboczego, takiego jak Moje dokumenty, i umieść je w bezpiecznym miejscu. Pliki archiwum są uporządkowane w następujący sposób:
[email protected].
. . [email protected]
. .. Reader
. ... followers.json
. ... following.json
. ... liked.json
. ... notes.json
. ... shared-by-followers.json
. ... shared.json
. ... starred.json
. ... subscriptions.xml
Istnieją dwa typy plików w archiwum: JSON i XML.Pliki JSON( JavaScript Object Notation) są po prostu typem formatu wymiany danych, a pliki XML( Extensible Markup Language) są poręcznym sposobem oznaczania dokumentu, tak aby był on zarówno czytelny dla komputera, jak i dla człowieka. Plik, który najbardziej nas interesuje w tym samouczku, to plik starred.json, ponieważ zawiera wszystkie wpisy dotyczące elementów oznaczonych gwiazdką.
Równie ważne w wielkim schemacie uwalniania danych z Czytnika Google i przechodzenia na bardziej zielone pastwiska jest jednak plik subscriptions.xml. Ten plik zawiera wszystkie twoje subskrypcje RSS i, jeśli chcesz importować wszystkie stare subskrypcje z Czytnika Google do nowej aplikacji RSS, jest to plik, którego będziesz używał.Zdecydowanie przechowuj go( i oryginalne archiwum pobrane z Google Takeout) w bezpiecznym miejscu.
Przekształcanie elementów oznaczonych gwiazdką w zakładki
Jednym z najprostszych sposobów radzenia sobie z plikiem JSON jest użycie JSONview( rozszerzenia dostępnego zarówno dla przeglądarki Firefox, jak i Chrome).Ta metoda najlepiej nadaje się dla czytelników, którzy mają niewielką liczbę elementów oznaczonych gwiazdką w Czytniku Google( mniej niż 1000).
Zainstaluj rozszerzenie dla swojej przeglądarki, a następnie przeciągnij i upuść plik starred.json na nowe okienko przeglądarki. Zapisz wynikowy plik jako dokument HTML.Następnie możesz skręcić w prawo i zaimportować dokument HTML do wybranej przeglądarki internetowej, a wszystkie linki zostaną zaimportowane jako nowe zakładki.
Istnieją jednak dwie wady tej techniki. Po pierwsze, w pliku zakładek pojawią się zduplikowane adresy URL, ponieważ adres URL głównej domeny / głównego artykułów często oznaczonych gwiazdką( np. Powiedz, artykuły z How-To Geek) pojawi się kilka razy. To trochę denerwujące, ale nie takie duże.
Drugą wadą jest łamacz transakcji dla osób z wieloma gwiazdkami( tych z nami z tysiącami pozycji oznaczonych gwiazdką);kiedy mamy do czynienia z naprawdę ogromnym importem HTML, w większości przypadków po prostu się psuje i nigdy się nie kończy. Oczywiście jest to wysoce niezadowalające rozwiązanie dla zaawansowanych użytkowników programu Reader, ponieważ nigdy nie kończy importowania elementów oznaczonych gwiazdką.Jeśli jesteś zaawansowanym użytkownikiem i masz do dyspozycji tysiące przedmiotów z gwiazdkami, importowanie ich jako zakładki po prostu go nie przerwie.
Konwersja elementów oznaczonych gwiazdką do pojedynczych linków( i importowanie do Evernote)
Dla potrzeb dużej mocy obliczeniowej, jakiej potrzebują użytkownicy( rodzaj przetwarzania, który w ciągu kilku minut przetnie nawet 5000 elementów oznaczonych gwiazdką), zwracamy się do Pythona, aby pomóc namprzechytrzyć naszą ogromną listę.
Dzięki uprzejmości Paula Kerchena i Davide Della Casa, dwóch potężnych użytkowników Google Reader, którzy chcieli wyeksportować wszystkie swoje stare pozycje oznaczone gwiazdką, mamy dwa bardzo przydatne skrypty w języku Python, które mogą nam pomóc w jednej z dwóch rzeczy: 1) przekonwertować wszystkie pozycje oznaczone gwiazdkąw odrębne dokumenty HTML i / lub 2) importować wszystkie nasze oznaczone gwiazdkami elementy do Evernote.
Obie sztuczki wymagają zainstalowania w systemie Python. Chwyć kopię Pythona dla swojego systemu operacyjnego i zainstaluj go przed kontynuowaniem.
Po zainstalowaniu Pythona odwiedź stronę projektu eksportu Czytnika Google Kerchen / Casa i zapisz pliki export2HTMLFiles.py oraz export2enex.py w tym samym folderze, do którego wyodrębniono plik starred.json.
Jeśli chcesz przekonwertować wszystkie oznaczone gwiazdką elementy na odrębne pliki HTML, możesz to zrobić za pomocą pliku export2HTMLFiles.py, wykonując następujące polecenie w katalogu, w którym przechowywany jest plik starred.json:
python export2HTMLFiles.py
( Jeśli pythonnie jest określona jako ogólnosystemowa komenda na komputerze, zastąp "python" pełną ścieżką do pliku wykonywalnego Pythona, np. C: \ Python2.7 \ python.exe)
W zależności od liczby elementów oznaczonych gwiazdką proces ten możezabrać w dowolnym miejscu od kilku sekund do kilku minut. Potrwało to około trzech minut, aby przebić 12 000 oznaczonych gwiazdkami przedmiotów podczas naszego testu.
Po zakończeniu będziesz mieć serię ponumerowanych i nazwanych plików HTML( np. 1 artykuł, w którym zaznaczyłeś gwiazdkę.html do 10000 jakiegoś innego artykułu, w którym zaznaczyłeś gwiazdkę.html).Najprostszym sposobem na obejrzenie ich wszystkich jest po prostu załadowanie lokalnego katalogu w przeglądarce.
To świetny sposób na uwolnienie elementów oznaczonych gwiazdką z Czytnika Google i pliku JSON, ale jak wspomnieliśmy wcześniej w samouczku, jeśli od wielu lat zapisujesz artykuły, aby móc je czytać, będziesz miał monumentalne zadaniena twoich rękach.
Jednym ze sposobów lepszego zarządzania tym zadaniem jest wykorzystanie Evernote jako obszaru roboczego do sortowania, oznaczania i potencjalnego usuwania nieużytecznych elementów oznaczonych gwiazdką.
Istnieją dwa sposoby importowania elementów do Evernote. Możesz zaimportować pliki HTML, które stworzyliśmy przed chwilą, używając folderu importu. W kliencie pulpitu Evernote możesz przejść do Narzędzia - & gt;Zaimportuj foldery, a następnie utwórz folder zrzutu dla plików HTML.Zrobiliśmy podfolder w folderze roboczym /Reader/ o nazwie Imports i nowy notes w Evernote o nazwie Elementy oznaczone gwiazdką.Przeciągając i upuszczając pliki HTML do folderu /Reader/Imports/, jesteśmy w stanie zaimportować je jako odrębne notatki do folderu Elementy oznaczone gwiazdką Evernote. Są tam na stałe przechowywane, aby można je było przejrzeć w wolnym czasie.
Alternatywnie, jeśli chcesz przekonwertować wszystkie elementy oznaczone gwiazdką do natywnego notatnika Evernote za jednym zamachem, możesz użyć drugiego skanu Pythona, który pobrałeś, export2enex.py, aby to zrobić.Zaletą tego jest to, że wykonuje nieco lepszą pracę zachowując formatowanie dokumentów.
W folderze, w którym znajduje się plik starred.json, uruchom następującą komendę:
python export2enex.py & gt;StarredImport.enex
Pobierz plik wynikowy StarredImport.enex i zaimportuj go do swojego klienta pulpitu Evernote za pomocą opcji Plik - & gt;Importuj - & gt;Pliki eksportu Evernote.
W tym momencie udało Ci się całkowicie uwolnić elementy oznaczone gwiazdką z Czytnika Google i możesz przejść do( potencjalnie długiego) biznesu sortowania stosu.
Czy masz sprytny sposób na manipulowanie plikiem JSON i wyodrębnianie elementów oznaczonych gwiazdką?Dołącz do poniższej dyskusji i dziel się swoimi wskazówkami i sztuczkami z innymi czytelnikami.