오랜만에 블로그에 알림이 떠서 보니, 어떤 분 께서 예전에 올린 파이썬 웹크롤링 예제 글에 질문을 해주셨다.
포스팅을 열심히 했으나 생각보다 댓글이 없어서 흥미를 잃어갔는데 이렇게 반응해주시는게 감사해서,
일 마치고 밤에 바로 해결해 보았다.
2020/05/13 - [Programming/Python] - Python) 파이썬 BeautifulSoup4를 이용해 웹 크롤링 예제 만들어 보기
질문자의 요지는, 내가 포스팅한 bs4 웹크롤링 예제에서
AttributeError: 'NoneType' object has no attribute 'get_text'
라는 오류가 발생한다는 것이였다.
읽어보니, 크롤링한 정보에서 get_text로 빼올 것이 없다는 오류인 것 같아 원인을 찾아보았다.
문제가 된 부분은 코로나 확진자 정보를 받아오는 부분으로,
ncov.mohw.go.kr
이 사이트에서 웹크롤링을 해오는 부분이였다. 오류를 보자마자 웹사이트의 html정보가 바뀌어서, 크롤링이 제대로 되지 않을 가능성이 가장 크다고 생각했다.
우선 웹 브라우저의 개발자 도구를 켜서, 내가 따올 부분의 html 소스를 분석한다.
신규 확진자의 정보를 알려주는 부분의 html span태그 클래스 이름이
"before"
이고, 누적 확진자의 정보를 알려주는 부분은
"num"
이다.