Framework/Springboot [Springboot] 스프링부트 데이터 수집 - 728x90 반응형 ▶ 데이터 수집 1. 기본 방법으로 수집 package prac01; import java.io.IOException; import java.io.InputStream; import java.net.URL; import java.net.URLConnection; public class 데이터수집1 { public static void main(String[] args) throws IOException { URL url = new URL("http://ggoreb.com/quiz/harry_potter.txt"); URLConnection con = url.openConnection(); InputStream in = con.getInputStream(); // getFileInputStream(); 으로 작성할경우 내장되어있는 파일을 가져올 수 있음 String result = ""; while(true) { int data = in.read(); if(data == -1) break; char c = (char) data; result += c; } System.out.println(result); } } 2. euc-kr 문자 표현 방식으로 변경 후 수집 package prac01; import java.io.BufferedReader; import java.io.IOException; import java.io.InputStream; import java.io.InputStreamReader; import java.net.URL; import java.net.URLConnection; public class 데이터수집2 { public static void main(String[] args) throws IOException { URL url = new URL("http://ggoreb.com/quiz/운수좋은날.txt"); URLConnection con = url.openConnection(); InputStream in = con.getInputStream(); InputStreamReader isr = new InputStreamReader(in, "euc-kr"); BufferedReader reader = new BufferedReader(isr); String result = ""; while(true) { String data = reader.readLine(); if(data == null) break; result += data + "\n"; } System.out.println(result); } } 3. Jsoup (웹 크롤링 라이브러리) 를 이용한 데이터 수집 public class 데이터수집3 { public static void main(String[] args) throws IOException { Connection con = Jsoup.connect("http://ggoreb.com/hrd"); Document doc = con.get(); Elements items = doc.select("a"); for (int i = 0; i < items.size(); i++) { Element item = items.get(i); String text = item.text(); String href = item.attr("href"); System.out.println(text); System.out.println(href); } } } 728x90 반응형 공유하기 URL 복사카카오톡 공유페이스북 공유엑스 공유 게시글 관리 구독하기Feat Dev Contents 추천 컨텐츠 [Springboot] data.sql 한글 깨짐 현상 해결 방법 (.html or H2 DB) 2024.01.05 [Springboot] 스프링부트 예외처리 (try~catch~finally) 2023.11.13 [Springboot] 스프링부트 파일 클래스(File Class) 2023.11.13 [Springboot] 스프링부트 입출력 스트림 2023.11.13 -