기존에 스크래핑을 진행하기로 한 사이트에서
네트워크 패킷 분석 후 API를 찾아야한다.
근데 내가 가져오려는 사이트는 API는 숨겨둬서
HTML 코드를 파싱해서 데이터 저장을 다시 해야한다.
상세 보기에 있는 정보를 가져올려면 URL이 필요하니
URL을 가져오고 나서 가져와야하낟.
그리고 조건이 있는데 내가 이용하는 페이지는
더 알아보기를 누른 후 스크롤을 더 내려줘야
정보가 로드되는 시스템이다
[TIL] 2024.04.05 axios, puppeteer를 활용한 웹스크래핑 (0) | 2024.04.05 |
---|---|
[TIL] 2024.04.03 스크래핑 잘 안됨 (0) | 2024.04.03 |
[TIL] 2024.04.01 스크래핑 데이터 저장 (0) | 2024.04.01 |
[TIL]2024.03.28 HTTP, GET,POST 정리 (0) | 2024.03.29 |
[TIL] 2024.03.27 프로세스와 스레드 (1) | 2024.03.27 |