Java Jsoup Kütüphanesi

Jsoup kütüphanesi internet üzerinden bir sayfayı parse etmeniz gerektiğinde işinize yarayacak bir kütüphanedir. HTML parser olarak görebilirsiniz.

Örnek bir proje ve jsoup kodlarına bakarak anlatacağımız bu yazıda ilk olarak jsoup’ta ki methodlarına ve örneklerine bakalım.

İlk olarak jsoup kütüphanesini kurmak için yapmanız gerekenler.

1-) pom.xml için:

<dependency>

  <!– jsoup HTML parser library @ https://jsoup.org/ –>

  <groupId>org.jsoup</groupId>

  <artifactId>jsoup</artifactId>

  <version>1.10.3</version>

</dependency>

2-) https://jsoup.org/download jar’ı indirip library kısmına atabilirsiniz.

Şimdi netbeanste bir örnek proje yapmadan önce jsoup’u tanıyalım. Herşeyi hazır kullanabiliriz.

Aşağıda bir çok örnek ekledim. En önemlisi ise bu örnekleri sizin yapmanızı istemem. Try ve catch kullancaksınız. Android’te kullanmak isteyenler AsynTask yapısı ile başlayabilirsiniz. Ama RXJAVA öğrenmenizi tavsiye ediyorum. (Bende yeni başladım. Yakın zamanda yazısını ekleyeceğim.)

 

ilk başta bir url’e bağlantı için yapmamız gereken:

bir sayfanın title bilgisini almak için:

html’deki bütün linkleri almak için:

importlar için:

url’in meta bilgilerini almak için:

url’den bütün resimleri almak için:

bir sayfanın title ve body’si için,

 

Bir html file’i gösterip ondan veri almak için,

html file:

kod:

html kaynağını almak için:

Bağlantının header, cookie vs özelleştirme ihtiyacnız olduğunda;

Ek olarak html taglardan verileri alma kısmı,

id ve class’ı almak için,

html tag’ler arasında gezinme,

text’e ulaşmak için:

 

Örnek bir gazete manşetlerinden gazete, resim ve gazetenin manşetini alma uygulaması:

 

 

JsoupGazeteOku.java

Çıktı:

 

Post Author: umiitkose

Java Jsoup Kütüphanesi” için 2 yorum

  • Ahmet M

    (1 Ağustos 2017 - 03:46)

    Yazın çok güzel ellerine sağlık. Jsoup’u en çok clean özelliği için kullanıyorum. Belki o da eklenebilir yazıya :)

    • umiitkose

      (1 Ağustos 2017 - 09:31)

      Merhaba Ahmet Bey,

      O özelliği eklemeyi unutmuşum gün içerisinde güncelleme yaparak yazıya ekleyeceğim :)

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code class="" title="" data-url=""> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong> <pre class="" title="" data-url=""> <span class="" title="" data-url="">