#python #anaconda #jupyter-notebook #visual-code #html #css #javascript #http

제목[re][텀프로젝트] 이미지 크롤링 질문2020-06-15 14:35
작성자

1. 제가 원하는 날짜만 찾으려면 어떻게 해야 하나요? 또는 어떤 단어를 구글링해야 좋을까요?

-> 해당 사이트를 먼저 분석하는 것이 첫번째 입니다. 어떠한 형식을 가지는지 파악을 해야 크롤링이 가능합니다.

-> 해당 사이트에서 날짜를 검색할 수 있는 방법이 있나요? 있으면 selenium 같은 프레임워크를 통해 날짜값을 검색하는 곳에 입력하여 원하는 이미지들을 가져올 수 있습니다..

-> 혹은 url에 날짜 들어가는 것이 있는지 체크해보시면 그것또한 하나의 검색 방법이 되겠습니다.

-> 네이버 뉴스 url 예시 : https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=001&date=20200614 - date를 변경해서 접근 가능


2. 원하는 날짜를 찾았으면 그 날짜의 사진을 가져오고 싶은데 어떻게 해야 하나요? 또는 이 부분도 어떻게 구글링을 해야 좋을지 잘 모르겠습니다.

-> 일단 selenium과 beautifulsoup를 알아보는 것을 추천드립니다.

-> 위의 라이브러리들을 이용하면 웹 포맷 특정 위치의 image를 가져올 수 있습니다.


일단 해당링크를 먼저 참고해서 읽어보시고 추가적인 검색을 통해서 진행하시면 되겠습니다.

https://beomi.github.io/gb-crawling/ 

댓글