Księgarnia naukowo-techniczna styczna.pl

Księgarnia naukowo-techniczna
styczna.pl

 


Zaawansowane wyszukiwanie
  Strona Główna » Sklep » Informatyka » Programowanie » Moje Konto  |  Zawartość Koszyka  |  Do Kasy   
 Wybierz kategorię
Albumy
Architektura
Beletrystyka
Biochemia
Biologia
Biznes
Budownictwo
Chemia
Design DTP
E-biznes
Ekologia i środowisko
Ekonometria
Ekonomia Finanse
Elektronika
Elektrotechnika
Encyklopedie
Energetyka
Fizyka
Fotografia
Geografia
Historia
Informatyka
  Bazy danych
  Bezpieczeństwo
  CAD
  Grafika komputerowa
  iPod Pocket PC
  Kursy
  Media społecznościowe
  Office
  Programowanie
  Programy graficzne
  Sieci bezprzewodowe
  Sieci komputerowe
  Systemy operacyjne
  Techniki programowania
  Webmasterstwo
Maszynoznawstwo
Matematyka
Medycyna
Motoryzacja
Polityka
Popularnonaukowe
Poradniki
Prawo
Sport
Sztuka
Słowniki
Technika
Telekomunikacja
Turystyka
Zarządzanie jakością

Zobacz pełny katalog »
 Wydawnictwo:
 PZWL
Techniki operacyjne stosowane w leczeniu neuropatii uciskowych kończyny górnej + DVD

Techniki operacyjne stosowane w leczeniu neuropatii uciskowych kończyny górnej + DVD

69.00zł
Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu. Wydanie II 59.00zł 44.25zł
Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu. Wydanie II

Tytuł: Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu. Wydanie II
Autor: Ryan Mitchell
ISBN: 978-83-283-5635-1
Ilość stron: 272
Data wydania: 07/2019
Format: 168x237
Wydawnictwo: HELION

Cena: 59.00zł 44.25zł


Ekstrakcję danych (ang. web scraping), zwaną też wydobywaniem danych z zasobów internetu, wiele osób postrzega jako wyższy stopień wtajemniczenia: przy niewielkim wysiłku można uzyskać imponujące wyniki i wykorzystać je w różnoraki sposób. Nie dziwi więc, że wokół tej dziedziny narosło mnóstwo mitów. Wątpliwości jest wiele, począwszy od legalności tego rodzaju praktyk, skończywszy na właściwościach różnych narzędzi. W praktyce na ekstrakcję danych składa się cały szereg zróżnicowanych technik i technologii, takich jak analiza danych, analiza składniowa języka naturalnego, a także zabezpieczenie informacji. Aby w pełni wykorzystać ich zalety, konieczne jest zrozumienie sposobu, w jaki funkcjonują.

Ta książka jest znakomitym przewodnikiem po technikach pozyskiwania danych z internetu. Przedstawiono tu również zasady gromadzenia, przekształcania i wykorzystywania danych z różnych zasobów. W kontekście ekstrakcji danych omówiono zagadnienia związane z bazami danych, serwerami sieciowymi, protokołem HTTP, językiem HTML, bezpieczeństwem sieciowym, przetwarzaniem obrazów, analizą danych i wieloma innymi kwestiami. Zaprezentowane tu rozwiązania programistyczne zostały napisane w Pythonie. Nie zabrakło też omówienia bibliotek przydatnych w pracy osób tworzących roboty indeksujące. Dzięki tej książce szybko zaczniesz pozyskiwać i w dowolny sposób wykorzystywać posiadane dane. Już dziś te rozwiązania są stosowane w prognozowaniu rynkowym, tłumaczeniu maszynowym, a nawet w diagnostyce medycznej!

Najważniejsze zagadnienia:

  • korzystanie z platformy Scrapy do tworzenia robotów
  • metody odczytu, wydobywania i przechowywania pozyskiwanych danych
  • oczyszczanie i normalizacja danych
  • interfejsy API
  • przetwarzanie obrazów na tekst
  • testowanie witryn za pomocą robotów

Wyszukuj dane, gromadź je i korzystaj z nich do woli!

Rozdziały:

    • Przedmowa
      • Czym jest ekstrakcja danych z internetu?
      • Dlaczego ekstrakcja danych z internetu?
      • Informacje o książce
      • Konwencje używane w tej książce
      • Kod źródłowy
      • Podziękowania
    • Część I Tworzenie pełzaczy
    • Rozdział 1. Twój pierwszy robot indeksujący
      • Połączenie
      • Wprowadzenie do biblioteki BeautifulSoup
        • Instalacja biblioteki BeautifulSoup
        • Korzystanie z biblioteki BeautifulSoup
        • Stabilne połączenia i obsługa wyjątków
    • Rozdział 2. Zaawansowana analiza składniowa HTML
      • Młotek nie zawsze jest potrzebny
      • Kolejna porcja BeautifulSoup
        • Funkcje find() i find_all()
        • Inne obiekty biblioteki BeautifulSoup
        • Poruszanie się po drzewach hierarchii
          • Dzieci i pozostali potomkowie
          • Rodzeństwo
          • Rodzice
      • Wyrażenia regularne
      • Wyrażenia regularne w bibliotece BeautifulSoup
      • Uzyskiwanie dostępu do atrybutów
      • Wyrażenia lambda
    • Rozdział 3. Tworzenie robotów indeksujących
      • Poruszanie się po pojedynczej domenie
      • Pełzanie po całej witrynie
        • Gromadzenie danych z całej witryny
      • Pełzanie po internecie
    • Rozdział 4. Modele ekstrakcji danych
      • Planowanie i definiowanie obiektów
      • Obsługa różnych szat graficznych
      • Konstruowanie robotów indeksujących
        • Poruszanie się po witrynach za pomocą paska wyszukiwania
        • Poruszanie się po witrynach za pomocą odnośników
        • Poruszanie się pomiędzy różnymi typami stron
      • Właściwe podejście do procesu tworzenia modeli robotów indeksujących
    • Rozdział 5. Scrapy
      • Instalacja biblioteki Scrapy
        • Inicjowanie nowego pająka
      • Pisanie prostego robota indeksującego
      • Korzystanie z pająków przy użyciu reguł
      • Tworzenie elementów
      • Wyświetlanie elementów
      • Potoki elementów
      • Dzienniki zdarzeń w bibliotece Scrapy
      • Dodatkowe zasoby
    • Rozdział 6. Przechowywanie danych
      • Pliki multimedialne
      • Przechowywanie danych w plikach CSV
      • MySQL
        • Instalacja środowiska MySQL
        • Podstawowe polecenia
        • Integracja ze środowiskiem Python
        • Techniki bazodanowe i dobre rozwiązania
        • Sześć stopni oddalenia w środowisku MySQL
      • Alerty e-mail
    • Część II Zaawansowana ekstrakcja danych
    • Rozdział 7. Odczytywanie dokumentów
      • Kodowanie dokumentu
      • Pliki tekstowe
        • Kodowanie tekstu a internet globalny
          • Historia kodowania znaków
          • Kodowanie w akcji
      • Format CSV
        • Odczyt plików CSV
      • Format PDF
      • Edytor Microsoft Word i pliki .docx
    • Rozdział 8. Oczyszczanie danych
      • Oczyszczanie na poziomie kodu
        • Normalizacja danych
      • Oczyszczanie pozyskanych danych
        • OpenRefine
          • Instalacja
          • Korzystanie z aplikacji OpenRefine
            • Filtrowanie
            • Oczyszczanie
    • Rozdział 9. Odczyt i zapis języków naturalnych
      • Podsumowywanie danych
      • Modele Markowa
        • Sześć stopni oddalenia od Wikipedii podsumowanie
      • Natural Language Toolkit
        • Instalacja i konfiguracja
        • Analiza statystyczna za pomocą pakietu NLTK
        • Analiza leksykologiczna za pomocą pakietu NLTK
      • Dodatkowe zasoby
    • Rozdział 10. Kwestia formularzy i pól logowania
      • Biblioteka Requests
      • Przesyłanie podstawowego formularza
      • Przyciski opcji, pola zaznaczania i inne mechanizmy wprowadzania danych
      • Wysyłanie plików i obrazów
      • Pola logowania i ciasteczka
        • Podstawowe uwierzytelnianie protokołu HTTP
      • Inne problemy z formularzami
    • Rozdział 11. Ekstrakcja danych a język JavaScript
      • Krótkie wprowadzenie do języka JavaScript
        • Popularne biblioteki JavaScriptu
          • jQuery
          • Google Analytics
          • Google Maps
      • Ajax i dynamiczny HTML
        • Uruchamianie kodu JavaScriptu w środowisku Python za pomocą biblioteki Selenium
        • Dodatkowe obiekty WebDriver
      • Obsługa przekierowań
      • Końcowe uwagi na temat języka JavaScript
    • Rozdział 12. Ekstrakcja danych poprzez API
      • Krótkie wprowadzenie do API
        • Metody HTTP a API
        • Dodatkowe informacje na temat odpowiedzi API
      • Analizowanie składni formatu JSON
      • Nieudokumentowane API
        • Wyszukiwanie nieudokumentowanych API
        • Dokumentowanie nieudokumentowanych API
        • Automatyczne wyszukiwanie i dokumentowanie API
      • Łączenie API z innymi źródłami danych
      • Dodatkowe informacje na temat API
    • Rozdział 13. Przetwarzanie obrazów i rozpoznawanie tekstu
      • Przegląd bibliotek
        • Pillow
        • Tesseract
          • Instalacja aplikacji Tesseract
          • pytesseract
        • NumPy
      • Przetwarzanie prawidłowo sformatowanego tekstu
        • Automatyczne korygowanie obrazów
        • Ekstrakcja danych z obrazów umieszczonych w witrynach
      • Odczytywanie znaków CAPTCHA i uczenie aplikacji Tesseract
        • Uczenie aplikacji Tesseract
      • Ekstrakcja kodów CAPTCHA i przesyłanie odpowiedzi
    • Rozdział 14. Unikanie pułapek na boty
      • Kwestia etyki
      • Udawanie człowieka
        • Dostosuj nagłówki
        • Obsługa ciastek za pomocą języka JavaScript
        • Wyczucie czasu to podstawa
      • Popularne zabezpieczenia formularzy
        • Wartości ukrytych pól wejściowych
        • Unikanie wabików
      • Być człowiekiem
    • Rozdział 15. Testowanie witryn internetowych za pomocą robotów indeksujących
      • Wprowadzenie do testowania
        • Czym są testy jednostkowe?
      • Moduł unittest
        • Testowanie Wikipedii
      • Testowanie za pomocą biblioteki Selenium
        • Interakcje z witryną
          • Przeciąganie i upuszczanie elementów
          • Zrzuty ekranu
      • Selenium czy unittest?
    • Rozdział 16. Zrównoleglanie procesu ekstrakcji danych
      • Procesy i wątki
      • Wielowątkowa ekstrakcja danych
        • Wyścigi i kolejki
        • Moduł threading
      • Wieloprocesowa ekstrakcja danych
        • Przykład z Wikipedią
        • Komunikacja międzyprocesowa
      • Wieloprocesowa ekstrakcja danych metoda alternatywna
    • Rozdział 17. Zdalna ekstrakcja danych z internetu
      • Powody korzystania z serwerów zdalnych
        • Unikanie blokowania adresu IP
        • Przenośność i rozszerzalność
      • Tor
        • PySocks
      • Hosting zdalny
        • Uruchamianie z poziomu serwisu hostingowego
        • Uruchamianie z poziomu chmury
      • Dodatkowe zasoby
    • Rozdział 18. Legalność i etyka ekstrakcji danych z internetu
      • Znaki towarowe, prawa autorskie, patenty, ojej!
        • Prawo autorskie
      • Naruszenie prawa własności rzeczy ruchomych
      • Ustawa o oszustwach i nadużyciach komputerowych
      • Plik robots.txt i warunki świadczenia usług
      • Trzy roboty indeksujące
        • Sprawa eBay przeciwko Bidders Edge (prawo własności rzeczy ruchomych)
        • Sprawa Stany Zjednoczone przeciwko Auernheimerowi (ustawa CFAA)
        • Sprawa Field przeciwko Google (prawo autorskie i plik robots.txt)
      • Co dalej?
      • O autorce
      • Kolofon

Najniższa cena z 30 dni przed obniżką 44,25zł

Tytuł książki: "Ekstrakcja danych z językiem Python. Pozyskiwanie danych z internetu. Wydanie II"
Autor: Ryan Mitchell
Wydawnictwo: HELION
Cena: 59.00zł 44.25zł
Klienci, którzy kupili tę książkę, kupili także
Bunty w późnorepublikańskich armiach rzymskich (88-30 przed Chr.)
Bunty w późnorepublikańskich armiach rzymskich (88-30 przed Chr.)
Michał Norbert Faszcza
Napoleon V
Drgania układów mechanicznych
Drgania układów mechanicznych
Tadeusz Majewski
PWN
Standardy kardiologiczne 2013 okiem echokardiografisty
Standardy kardiologiczne 2013 okiem echokardiografisty
Płońska-Gościniak Edyta
Medical Tribune
Microsoft Windows Server 2008 R2 Vademecum administratora Wydanie II
Microsoft Windows Server 2008 R2 Vademecum administratora Wydanie II
William R. Stanek
Microsoft Press
Polsko-arabski słownik tematyczny
Polsko-arabski słownik tematyczny
Magdalena Lewicka
KRAM
Power4Change. Sztuka osiągania celów
Power4Change. Sztuka osiągania celów
Marek Kamiński
Onepress
 Koszyk
1 x Gruntowo-powłokowe konstrukcje z blach falistych
1 x Audi A3 od maja 2003 (typu 8P)
1 x Brewiarz miłości doświadczalnej
1 x Ciężar dowodu w polskim prawie ochrony środowiska
1 x 160 pomysłów na nauczanie zintegrowane w klasach I-III Przyroda
1 x Album Polski
1 x Detoks Książka kucharska
1 x Bzura i jej dopływy Encyklopedia rzek Polski
1 x Angielsko-polski słownik medyczny Słownik podręczny
1 x Ford Fiesta (od III 2002 do VII 2008)
1 x Pomiar uniwersalny Odkrywanie w biznesie wartości niematerialnych
1 x Co jeść przy chorobach żołądka i jelit Przepisy na wyśmienite i zdrowe potrawy
1 x Sweet Cheeks Zapach namiętności
1 x Dawno temu był sobie algorytm Czyli jak książki, filmy i życie codzienne wyjaśniają nam dziedzinę algorytmów
1 x Elektrotechnika i elektronika w pojazdach samochodowych
1 x 30 sekund o energii 50 kluczowych pojęć, teorii i hipotez przedstawionych w pół minuty
1 x Down Shift. Bez hamulców. Seria Driven
1 x Cuda Polski Najpiękniejsze budynki i budowle
1 x 101 najwybitniejszych postaci w dziejach Polski i świata
1 x Prawo telekomunikacyjne
1 x Bliżej Azji Współczesne wyzwania dla bezpieczeństwa
1 x Historia sztuki Architektura
1 x Instrumentalne metody badania wody i ścieków
1 x Angielsko-polski słownik fizyczny Słownik podręczny
1 x Aniołowie Pochodzenie, historia, ikonografia istot niebieskich
1 x Arcydzieła światowej architektury
1 x Ekologiczna praca 100 sposobów, aby ochrona środowiska stała się naszym znakiem firmowym
1 x Harib
1 x Atlas gór świata Szczyty marzeń
1 x Aktywność dyplomacji USA wobec państw członkowskich Unii Europejskiej w latach 2009-2013
1 x Obróbka skrawaniem
1 x Czas końca czas początku Architektura i urbanistyka Warszawy historycznej 1939-1956
1 x ART DECO Przewodnik dla kolekcjonerów
1 x Dlaczego kobiety uprawiają seks
1 x Doładowanie silników Wydanie 4
1 x 5 lat młodsza w 5 tygodni
1 x Fotografia cyfrowa dla bystrzaków Wydanie V
1 x Chrześcijańskie inspiracje w pedagogice
1 x Bruno Schulz
1 x Bezpieczeństwo energetyczne i ochrona klimatu w drugiej dekadzie XXI wieku Energia - środowisko - klimat
1 x 300 faktów Ludzkie ciało
1 x Cuda Anglii i Szkocji
1 x Churchill Najlepszy sojusznik Polski
1 x Edycja tekstów Praktyczny poradnik
1 x Dirty Dive Bar
2,097.83zł
Wydawnictwo
Tu można zobaczyć wszystkie książki z wydawnictwa:

Wydawnictwo Helion
 Kategoria:
 Matematyka
Sposób na matmę Sprytne metody+mniej stresu=lepsze stopnie !

Sposób na matmę Sprytne metody+mniej stresu=lepsze stopnie !

34.00zł
28.90zł
Informacje
Regulamin sklepu.
Koszty wysyłki.
Polityka prywatności.
Jak kupować?
Napisz do Nas.
 Wydawnictwa
 Polecamy
Anatomia zwierząt Tom 2 Narządy wewnętrzne i układ krążenia Wydanie 3 Kazimierz Krysiak, Krzysztof Świeżyński PWN
Animacja komputerowa Algorytmy i techniki Rick Parent PWN
Rachunek różniczkowy i całkowy Tom 1 Wydanie 12 Grigorij M. Fichtenholz PWN
Programowanie Microsoft SQL Server 2008 Tom 1 + Tom 2 Leonard Lobel, Andrew J. Brust, Stephen Forte Microsoft Press
MERITUM Podatki 2018 Aleksander Kaźmierski Wolters Kluwer
Miejscowa wentylacja wywiewna Poradnik Optymalizacja parametrów powietrza w pomieszczeniach pracy Maciej Gliński DW Medium
Windows Server 2008 R2 Usługi pulpitu zdalnego Resource Kit Christa Anderson, Kristin L. Griffin, Microsoft Remote Desktop Virtual Microsoft Press
Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach z medycyny KOMPLET Tom 1 Tom 2 Tom 3 Andrzej Stanisz StatSoft
Akademia sieci CISCO CCNA Exploration Semestr 1 - 4 Praca zbiorowa PWN