Мазмуну:

Жашыруун Дирихлет бөлүштүрүүнү кантип колдоносуз?
Жашыруун Дирихлет бөлүштүрүүнү кантип колдоносуз?

Video: Жашыруун Дирихлет бөлүштүрүүнү кантип колдоносуз?

Video: Жашыруун Дирихлет бөлүштүрүүнү кантип колдоносуз?
Video: ЖАШЫРУУН КОД | Трейлер - 2022 | Режиссер - Адилет Абдиев 2024, Май
Anonim

LDA деген эмне?

  1. Бөлүктөрүңүздүн уникалдуу топтомун тандаңыз.
  2. Каалаган композиттерди тандаңыз.
  3. Ар бир композицияга канча бөлүк керек экенин тандаңыз (Пуассон үлгүсүнөн бөлүштүрүү ).
  4. Каалаган темаларды (категорияларды) тандаңыз.
  5. Нөл эмес жана оң чексиздиктин ортосундагы санды тандап, аны альфа деп атаңыз.

Ошо сыяктуу эле, сиз сурасаңыз болот, Latent Dirichlet Allocation машинасын үйрөнүп жатабы?

Жашыруун Дирихлет бөлүштүрүү ( LDA ) корпустун генеративдик ыктымалдык модели. Негизги идея - документтер кокус аралашмалар катары көрсөтүлөт жашыруун темалар, мында ар бир тема сөздөр боюнча бөлүштүрүү менен мүнөздөлөт.

Ошо сыяктуу эле, LDA тема моделдөө кандай иштейт? LDA документтер темалардын аралашмасынан жасалган деп ойлойт. Бул темалар, алардын ыктымалдык бөлүштүрүүнүн негизинде сөздөрдү жаратат. документтердин маалымат топтомун эске алуу менен, LDA артка чегинип, кандай темаларды аныктоого аракет кылат болмок биринчи кезекте ошол документтерди түзүү. LDA матрицаны факторизациялоо ыкмасы болуп саналат.

Ушуга байланыштуу, жашыруун Дирихлет бөлүштүрүүнү кантип айтасыз?

“Ч” тыбышы “ш” тыбышы же катуу “к” тыбышы сыяктуу айтыла берет. Ал эми “et” аягы французча модада “lay” же катуу “t” тыбышы менен “лет” деп айтылса болот. Жашыруун Дирихлет бөлүштүрүү биринчи жолу 2003-жылы илимий эмгекте түшүндүрүлгөн, бирок көпчүлүк ыкмалар сыяктуу эле, негизги идеялар мурда жарыяланган.

Латенттик Дирихлет бөлүштүрүү көзөмөлдөбү же көзөмөлсүзбү?

Бул туура LDA болуп саналат көзөмөлсүз ыкмасы. Бирок, аны а чейин узартса болот көзөмөлдөгөн бир.

Сунушталууда: