Мазмуну:

Pythonдо кооз шорпону кантип колдоносуз?
Pythonдо кооз шорпону кантип колдоносуз?

Video: Pythonдо кооз шорпону кантип колдоносуз?

Video: Pythonдо кооз шорпону кантип колдоносуз?
Video: Как приготовить китайский новогодний ужин (включено 12 блюд) 2024, Апрель
Anonim

Эгер сиз Debian же Ubuntu Linuxтун акыркы версиясын колдонуп жатсаңыз, система пакетинин менеджери менен Beautiful Soup орното аласыз:

  1. $ apt-get орнотуу питон -bs4 (үчүн Python 2)
  2. $ apt-get орнотуу python3-bs4 (үчүн Python 3)
  3. $ easy_install beautifulsuup4.
  4. $ pip install beautifulsoup4.
  5. $ питон setup.py орнотуу.

Ошо сыяктуу эле, адамдар Python менен кантип кооз шорпо жасайсыз деп сурашат.

Колдонуу сулуу шорпо , аны орнотуу керек: $ pip install beautifulsoup4. Керемет шорпо ошондой эле талдоочуга таянат, демейки lxml. Сиз буга чейин мүмкүн бар аны, бирок сиз текшерүү керек (IDLE ачып, lxml импорттоого аракет). Болбосо, төмөнкүнү аткарыңыз: $ pip install lxml же $ apt- алуу орнотуу питон -lxml.

Ошо сыяктуу эле, сулуу шорпо кантип импорттоого болот? Баштоо, импорттоо the Керемет шорпо китепканага кирип, HTML файлын ачып, аны өткөрүп бериңиз Керемет шорпо , анан басып чыгаруу сулуу ” версиясы терминалда. Терминал терезеңиздин түпнуска html текстинин жакшы чегинген версиясы менен толтурулганын көрүшүңүз керек (3-сүрөттү караңыз).

Анын сыңарындай, кооз шорпо эмнеге колдонулат деп суралат.

Керемет шорпо HTML жана XML документтерин талдоо үчүн Python пакети (анын ичинде туура эмес түзүлүшү бар, б.а. жабылбаган тегдер, тегдин аты менен аталган. шорпо ). Бул талданган барактар үчүн талдоо дарагын түзөт колдонулган веб кыргыч үчүн пайдалуу болгон HTMLден маалыматтарды алуу.

Python жана BeautifulSoup менен веб-сайтты кантип кырууга болот?

Биринчиден, биз колдоно турган бардык китепканаларды импорттообуз керек. Андан кийин, барактын url үчүн өзгөрмө жарыялаңыз. Андан кийин, колдонуңуз Python urllib2 жарыяланган url HTML барагын алуу үчүн. Акырында, баракты талдоо BeautifulSoup биз колдоно турган формат BeautifulSoup анын үстүндө иштөө.

Сунушталууда: