CHAPTER 10

자바스크립트 스크레이핑

클라이언트 쪽 스크립트 언어는 웹 서버가 아니라 브라우저 자체에서 동작하는 언어입니다. 클라이언트 쪽 언어의 성공은 브라우저가 그 언어를 정확히 해석하고 실행할 수 있는지에 달려 있습니다(브라우저마다 자바스크립트를 끄는 기능이 있는 데에는 다 이유가 있습니다).

클라이언트 쪽 언어가 서버 쪽 언어보다 적어진 데는 모든 브라우저 제작자들이 표준에 동의하기 어렵다는 이유도 어느 정도 있습니다. 그런데 이건 웹 스크레이핑에서는 다행이죠. 대응해야 할 언어가 적을수록 좋으니까요.

온라인에서 자주 마주칠 언어는 플래시 애플리케이션에서 사용하는 액션스크립트와 자바스크립트 둘뿐입니다. 액션스크립트는 10년 전에 비하면 거의 사라지다시피 했으며, 지금 용도는 주로 온라인 게임에서의 멀티미디어 파일 스트리밍, 그리고 이제는 아무도 원하지 않는다는 사실을 미처 깨우치지 못한 사이트에서 시작 페이지를 장식하는 용도가 있습니다. 어쨌든 플래시 페이지를 스크레이핑할 필요는 거의 없으므로, 최신 웹 페이지에 거의 어디서나 쓰이는 자바스크립트에 대해서만 설명하겠습니다.

자바스크립트는 현재 웹에서 가장 널리 쓰이고 가장 잘 지원되는 클라이언트 스크립트 언어입니다. 자바스크립트는 사용자 추적을 위한 정보 수집, 폼을 새로 고치지 ...

Get 파이썬으로 웹 크롤러 만들기: 초간단 나만의 웹 크롤러로 원하는 데이터 가져오는 방법 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.