beautifulsoup - 唬嚨德拉

最近參加了一個機器學習的線上課程，一腳踩下去才發現事情不是憨人想得這麼簡單，那個號稱新手也可以輕鬆入門的課程，根本就預設所有人都是Python和統計老手。於是乎高中數學被當的慘不忍睹 + Python超級初心者如我，在被荼毒了幾個禮拜之後，終於發現應該要來打基礎了，順便逼自己寫文章。

雖然標題打了01，但也不知道會不會有02，ㄏㄏ

我覺得要厚顏無恥的從最基本開始練習，因為一直以來都沒有好好的去了解自己到底在寫三小，每次都各種在Github和Stackoverflow複製貼上，所以這邊也當作自己的學習筆記唄。這次就以爬取PTT joke板作為範例。

首先，抓東西前要知道自己到底要抓啥，剛剛提到要來抓PTT Joke板的資訊，所以先去找到PTT joke板的網頁版url如下：https://www.ptt.cc/bbs/joke/index.html

現在可以看到，現場有三個比較明顯的東西可以抓：標題、作者、日期，因為等下抓的時候要知道他在頁面上的位置，所以我們用Chrome開發者工具看一下要怎麼抓他們。

可以看到標題所使用的class是title，以此類推，作者是author，日期是date，然後他們都被包在r-ent裡面。以上就是這次所需要的所有資料，接下來就可以來寫爬蟲了。

總之先抓個Requests模組壓壓驚，使用requests.get來抓取目標頁面，這樣就抓完了。