
Poglądy są jak pępki – każdy ma swój
Większość firm chce wiedzieć, co mówią o nich klienci, ale nikt nie ma czasu na przeczytanie 1000 odpowiedzi na ankietę lub tylu recenzji produktu. Zamiast tego oczekujemy krótkiego podsumowania. Najczęściej przy ocenie produktu widzimy ranking gwiazdek – im produkt lepszy, tym więcej ich otrzymuje. Ale gwiazdki nie powiedzą nam co w tym produkcie klienci cenią najbardziej, co najmniej.
Tradycyjne techniki Natural Language Processing polegają na zliczaniu wystąpień danych słów lub wyrażeń w tekście. Często tekst poddany zostaje analizie „machine learning” i „training” co jest niczym innym jak raczej prymitywną, siłową metoda klasyfikowania tekstu na podstawie wcześniej odpowiednio sklasyfikowanego materiału.

Jak pobrać dane z Web Service do Oracle
Czyli jak połączyć się z Web Serwisem, pobrać dane, sparsować je i załadować do bazy danych lub użyć w aplikacji. Oto czego będziesz potrzebować:
- Uprawnienia w bazie danych do wykonywania połączeń HTTP
- Wgrany certyfikat Web Serwisu z którym się łączysz - jeśli połączenie jest https (przeważnie jest)
- Umiejętności parsowania JSON w Oracle. Zazwyczaj WS zwraca dane w formacie JSON
- Umiejętności szyfrowania danych (np. sekretkey) - jeśli WS tego wymaga
Wszystko powyższe przećwiczymy w tym artykule. W pierwszej części informacja o niezbędnych komponentach. Być może niektóre z nich nie są Ci potrzebne, pomiń te sekcje, ale w realnym scenariuszu rzadko jest potrzeba wykonania tylko trywialnego polaczenia z prostyym serwisem i wykonanie GET. Najczęściej jest potrzeba kodowania danych, parsowania wyników. Dlatego ten przykład jest inny od wiekszości przykładów w Internecie. W drugiej części zbierzemy wszystko do kupy w działającą procedurę.

Integracja Pentaho Kettle z Elasticsearch
W tym artykule dowiesz się jak pobrać dane z Elasticsearch z poziomu Pentaho Kettle. Elasticsearch jest bazą typu noSQL która oferuje wysoką prędkość odczytu nieustrukturyzowanych danych. Dostęp do bazy Elasticsearch jest nieco inny niż do baz SQL. Jeśli zatem masz zbiory danych w tym formacie i chcesz się do nich podłączyć z poziomu Pentaho, zobacz jak możesz to uzyskać.

Pentaho Report Designer - automatyzowanie raportów
W poprzednim artykule, Pentaho Report Designer - podstawy, dowiedział(a)ś się jak utworzyć pierwszy raport w Pentaho Report Designer. Teraz zajmiemy się automatycznym tworzeniem raportów w PRD. PRD umożliwia jak wiele takich narzędzi tworzenie raportów które możesz eksportować do statycznych formatów jak PDF, HTML, CSV... Cała jednak moc tego narzędzia to przygotowywanie treści dynamicznie, w zależności od obecnego stanu danych.
Dzięki temu możliwe jest np. tworzenie:
- Plików Excela zawierających podsumowania dla każdego z kontrahentów
- Mailingu do klientów
- Raportów z obrotem każdej dywizji sprzedażowej z podziałem na grupy handlowe uzupełniony wykresami
- Wygenerowanie i wysyłka faktur do klientów