★ 4.5 (523)
⏱ 1 jam 20 min
📚 9 pelajaran
🎧 Versi audio
Tentang kursus ini
Raw scanned documents and images contain valuable data, but unlocking that information requires bridging the gap between computer vision and natural language processing. This text-based course guides you through the process of building an intelligent document parsing pipeline. You will learn how to clean document images, extract raw text, and train a custom Named Entity Recognition (NER) model to automatically identify and structure crucial data points.
What you'll learn:
- Understand the foundational concepts of computer vision, optical character recognition (OCR), and natural language processing.
- Clean and preprocess document images using OpenCV to optimize them for text extraction.
- Extract text from images using Pytesseract and format it for downstream processing.
- Label text data manually using the BIO (Inside-Outside-Beginning) tagging schema for custom entity extraction.
- Train a custom Named Entity Recognition (NER) model using modern SpaCy configuration pipelines.
- Structure extracted text into clean, validated data formats using modern Python validation techniques.
We begin with the core definitions and setup of your Python environment. Next, you will progress through image preprocessing, OCR text extraction, manual text labeling, and training your custom NLP model, concluding with structuring your extracted data. This course is designed for beginner Python developers, data enthusiasts, and aspiring machine learning engineers, requiring only basic Python knowledge to start. Start reading today to turn unstructured document images into clean, actionable data.
Apa yang anda dapat
-
📜
Sijil tamat
Tambah ke profil LinkedIn anda
-
💬
Personal AI tutor
Stuck on a lesson? Ask your built-in tutor anything, any time.
-
🎧
Termasuk versi audio
Belajar sambil bergerak — tanpa skrin
-
♾️
Akses seumur hidup
Kembali bila-bila masa, tiada tamat tempoh
-
📱
Telefon atau komputer
Berfungsi di mana-mana, mana-mana peranti
-
💸
Pulangan 30 hari
Tanpa soalan
-
⚡
Pendek dan fokus
1 jam 20 min kandungan praktikal
Ulasan (2)
Sangat menikmati aliran ini. Contohnya tepat dan membantu saya memahami bahan dengan cepat. Nilai yang hebat.
Saya tidak pasti ini untuk pemula, ia mengambil sedikit pengetahuan yang tidak diajar secara jelas, beberapa contohnya agak kabur.
Pelajar lain juga mengambil
Transformers dari Awal dengan PyTorch
Kuasai mekanisme self-attention dan bina seni bina asas di sebalik AI moden, langkah demi langkah.
★ 5.0 (19)
$4.99
Model Turutan untuk NLP: Bina RNN, LSTM, dan GRU
Belajar asas pemodelan susunan untuk membina aplikasi penjanaan teks, penterjemahan, dan pengenalan ucapan menggunakan rangkaian saraf berulang.
★ 4.8 (1,308)
$4.99
Pembelajaran Dalaman untuk NLP: Penyalin Perkataan dan Klasifikasi Teks dalam Python
Menguasai asas pemprosesan bahasa semulajadi dengan melaksanakan word2vec, GloVe, dan rangkaian saraf berulang untuk membina pengklasifikasi teks pintar dalam Python.
★ 4.7 (8,585)
$4.99
Pemprosesan Bahasa Semulajadi dengan Python: Dari Vektor Teks ke AI Agentik
Bina asas yang kuat dalam pemprosesan teks, model vektor, dan teknik pembelajaran mesin untuk merancang aplikasi bahasa pintar dan memahami sistem AI moden.
★ 4.7 (7,233)
$4.99
Soalan lazim
Apa yang saya perlukan untuk mengikuti kursus ini?
+
Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.
Bagaimana untuk membayar?
+
Dengan kad melalui Stripe, atau kripto. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.
Bolehkah saya dapatkan bayaran balik?
+
Ya — pulangan penuh dalam 30 hari, tanpa soalan.
Berapa lama saya akan mempunyai akses?
+
Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.
Adakah saya akan mendapat sijil?
+
Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.
Direka untuk pelajar dalam
Teknologi
Reka bentuk
Kewangan
Pemasaran
Kesihatan
Pendidikan
Hospitaliti
Pembuatan