Báo cáo luận văn Tìm hiểu “Công nghệ nhận dạng hình ảnh”

ppt 30 trang yendo 10270
Bạn đang xem 20 trang mẫu của tài liệu "Báo cáo luận văn Tìm hiểu “Công nghệ nhận dạng hình ảnh”", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptbao_cao_luan_van_tim_hieu_cong_nghe_nhan_dang_hinh_anh.ppt

Nội dung text: Báo cáo luận văn Tìm hiểu “Công nghệ nhận dạng hình ảnh”

  1. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  2. TÌM HIỂU “CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH” GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  3. Trước tiên, em xin gửi lời cảm ơn tới Khoa CNTT – trường Cao Đẳng Kinh tế Công nghệ Tp.HCM đã tạo điều kiện và cho em cơ hội được thực hiện luận văn tốt nghiệp này. Qua bài báo cáo này, em cũng xin chân thành cảm ơn : Thầy Trần Đức Hy, người trực tiếp hướng dẫn em trong thời gian thực hiện báo cáo luận văn tốt nghiệp. Cảm ơn thầy đã tạo điều kiện thuận lợi để em hoàn thành tốt bài báo cáo. Cảm ơn thầy đã tận tình chỉ bảo, hướng dẫn và giải đáp các vướng mắc trong quá trình nghiên cứu đề tài Các chị trong Ban thư kí khoa CNTT đã tạo điều kiện cho em được hoàn thành tốt bài luận của mình trong thời gian qua. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  4. Các anh chị trong hai phòng Xử lí dữ liệu và Công nghệ phần mềm thuộc Trung tâm thống kê tin học- Cục Thống Kê Tp.HCM đã giúp đỡ em rất nhiều trong quá trình nghiên cứu đề tài. Anh Nguyễn Quang Trung, Phó phòng Xử lí thông tin, Trung tâm Tin học thống kê khu vực II – Cục Thống kê Tp.HCM, người đã hướng dẫn em trong việc tìm hiểu “Công nghệ nhận dạng hỉnh ảnh và ứng dụng của nó trong việc nhập và lưu trữ dữ liệu”. Cũng xin cám ơn các bạn Nguyễn Thiện Lâm, Nguyễn Đức Tuấn và bạn Lê Quang Đức đã cùng chia sẻ những khó khăn và kinh nghiệm trong quá trình nghiên cứu và thực hiện luận văn. Cuối cùng em xin gửi tới cha mẹ, cô chú em lời cảm ơn, biết ơn chân thành nhất. Cảm ơn cha mẹ, cô chú đã tạo mọi điều thuận lợi nhất giúp con hoàn thành tốt việc học của mình ! GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  5. CÁC NỘI DUNG CHÍNH ❖ CHƯƠNG 1 MỞ ĐẦU ❖ CHƯƠNG 2 CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH ❖ CHƯƠNG 3 CÔNG NGHỆ NHẬN DẠNG KÍ TỰ QUANG HỌC [OCR] ❖ CHƯƠNG 4 HƯỚNG PHÁT TRIỂN GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  6. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  7. MỞ ĐẦU LÝ DO LỰA CHỌN ĐỀ TÀI KẾT QUẢ CỤ THỂ ĐẠT ĐƯỢC GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  8. LÝ DO Ngày nay, kể cả những người không chuyên đều ít nhiều nghe nói đến công nghệ nhận dạng hình ảnh qua các quảng cáo, giới thiệu các sản phẩm công nghệ số, các sản phẩm kĩ thuật cao(Hi-Tech). Chúng ta có thể đã quá quen thuộc với những dòng máy ảnh được quảng bá là có tích hợp công nghệ nhận diện hình ảnh(nhận diện khuôn mặt, nụ cười, ánh mắt ), các dòng máy Laptop(máy tính xách tay) có tích hợp công nghệ nhận diện khuôn mặt, hay dấu vân tay nhằm phục vụ cho cơ chế bảo mật GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  9. KẾT QUẢ CỤ THỂ ĐẠT ĐƯỢC  Đã hiểu được một cách tổng quan về : Công nghệ  Tiếp cận khái niêm mạng Nơ-ron và ứng dụng mạngnhận Nơ dạng-ron, Cônglan truyền nghệ ngượcnhận dạng trong hình nhận ảnh dạng nói kí tự chungquang vàhọc Công nghệ nhận dạng kí tự Quang học  Trong(OCR) quá nói trình riêng. nghiên cứu đề tài, em cũng được ôn lại một số kiến thức môn Xác suất thống kê như định luậtNắm Bayer ;được bắt được khái hiểu quát thêm một về quy môn trình “Trí xử thông lý minh nhânảnh, tạo”, nhận dạng ảnh, quy trình số hóa dữ liệu, tài liệu  Tiếp cận sử dụng hai phần mềm nhận dạng kí tự : VNDOCRTiếp cận 4.0với (phiênmột số bản thuật Demo) toán điểnvà Accent hình sử dụng Capturetrong nhận 7.5; vàdạng sử dụng tính năng nhận dạng kí tự quang học của bộ phần mềm ứng dụng văn phòng Microsoft Office ( phiên bản 2003 profesional )
  10. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  11. CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH NHẬN MẠNG NHẬN NHẬN NHẬN DẠNG NƠRON DẠNG DẠNG DẠNG THEO LAN MẪU TIẾNG HÌNH MẠNG TRUYỀN NÓI ẢNH NƠRON NGƯỢC GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  12. NHẬN DẠNG MẪU Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn. Nhận dạng mẫu( pattern recognition ) là quá trình nhận dạng dựa vào mẫu học đã biết trước. Ta gọi đó là quá trình Học có giám sát (supervised learning).  Nhận dạng mẫu nhằm mục đích phân loại dữ liệu (là các mẫu) dựa trên: hoặc là kiến thức tiên nghiệm (a priori) hoặc dựa vào thông tin thống kê được trích rút từ các mẫu có sẵn. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  13. NHẬN DẠNG TIẾNG NÓI Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp (classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ, hoặc các âm vị. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  14. NHẬN DẠNG HÌNH ẢNH Là giai đoạn cuối cùng trong các hệ thống sử lý ảnh và cũng là đích đến của toàn bộ quá trình xử lý hình ảnh. Nhận dạng hình ảnh cũng dựa trên lý thuyết nhận dạng mẫu nói chung. Có 3 phương pháp tiếp cận chính trong Nhận dạng hình ảnh : 1: Phương pháp nhận dạng dựa vào phân hoạch không gian; 2: Phương pháp nhận dạng cấu trúc; 3: Phương pháp nhận dạng dựa vào kĩ thuật mạng Nơ-ron (Neural Networks).
  15. NHẬN DẠNG DỰA THEO MẠNG NƠ-RON NTrênơron c sinhơ sở vật cấu có trúc nhiều của dạng nơron khác sinhnhau nhưhọc dạngtổng hình quát tháp, người dạng ta đề xuấttổ ong, mô dạng hình rễ cây.nơron Tuy nhân khác nhautạo gồm về hình 3 phần dạng, chính: chúng có cấu trúc và nguyên- Bộ lý tổnghoạt động liên chung.kết đầu vào - Bộ động học tuyến tính Một tế -bàoBộ n phiơron tuyến. gồm bốn phần cơ bản: - Các nhánh và rễ - Thân thần kinh (Soma) - Dây thần kinh (Axon - Khớp thần kinh . GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  16. MẠNG NƠ-RON LAN TRUYỀN NGƯỢC Thuật học lan truyền ngược là một trong những phát triển quan trọng trong mạng nơron.Thuật toán này được áp dụng cho các mạng nhiều lớp truyền thẳng (FeedForward) gồm các phần tử xử lý với hàm kích hoạt liên tục. Các mạng như vậy kết hợp với thuật toán học lan truyền ngược được gọi là mạng lan truyền. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  17. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  18. CÔNG NGHỆ NHẬN DẠNG KÍ TỰ QUANG HỌC [OCR] LỢI SỐ NHẬN CÁC LỊCH ÍCH QUY HÓA DẠNG HỆ SỬ CỦA TRÌNH TÀI KÍ NHẬN DEMO PHÁT SỐ SỐ LIỆU TỰ DẠNG TRIỂN HÓA HÓA LÀ QUANG CHỮ TÀI GÌ ? HỌC [OCR] LIỆU GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  19. SỐ HÓA TÀI LIỆU LÀ GÌ ?  Là việc chuyển đổi các loại tài liệu đang được lưu trữ bằng các phương tiện thông thường (tài liệu in, viết tay, hình ảnh, âm thanh, Microfilm, ) sang dạng dữ liệu số để từ đó có thể dễ dàng ứng dụng Tin học trong các công tác lưu trữ, quản lý, vận chuyển và khai thác. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  20. LỢI ÍCH CỦA VIỆC SỐ HÓA DỮ LIỆU  Tiết kiệm không gian lưu trữ;  Dễ dàng vận chuyển;  Khả năng truy xuất dữ liệu nhanh;  Độ bền và tính an toàn cao hơn;  Có thể hiệu chỉnh, sửa chữa khi cần thiết;  Chi phí giảm hơn so với phương pháp truyền thống;  Dễ dàng ứng dụng công nghệ hiện đại trong quá trình ứng dụng và khai thác. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  21. NHẬN DẠNG KÍ TỰ QUANG HỌC Nhận dạng ký tự quang học (Optical Character Recognition, viết tắt là OCR), là loại phần mềm máy tính tạo ra để chuyển các hình ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy scanner) thành các văn bản tài liệu. OCR được hình thành từ một lĩnh vực nghiên cứu về nhận dạng mẫu, trí tuệ nhân tạo, và machine vision. Hệ thống nhận dạng yêu cầu phải được huấn luyện với các mẫu của các ký tự cụ thể. Các hệ thống "thông minh" với độ chính xác nhận dạng cao đối với hầu hết các phông chữ hiện nay đã trở nên phổ biến. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  22. CÁC HỆ NHẬN DẠNG CHỮ  Bài toán nhận dạng chữ là một bài toán lớn và được quan tâm từ lâu. Bài toán này được phân thành 2 nhánh lớn:  Nhận dạng chữ in để phục vụ cho công tác đọc tự động văn bản, đẩy nhanh việc nhập thông tin vào máy.  Nhận dạng chữ viết tay với các font chữ khác nhau, phục vụ cho các ứng dụng đọc và xử lý hoá đơn, văn bản,v, ,v.  Về cơ chế, một hệ thống nhận dạng chữ thường gồm các khối chính, phù hợp với các giai đoạn xử lý sau: - Khối xử lý sơ bộ; - Khối tách chữ; - Khối nhận dạng chữ; - Khối phục hồi chữ (hoàn thiện về nội dung và hình thức, chữa lỗi, v, v. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  23. CÁC HỆ NHẬN DẠNG CHỮ Văn bản scanner S-File File nén File làm việc Sơ đồ Tách vùng chữ ra khỏi văn bản Xử lý sơ bộ tổng Tách ký tự ra khỏi từ quát Học kiểu chữ Nhận dạng chữ hệ thống File ASCII của máy nhận dạng Lưu trữ văn bản Tìm kiếm văn bản chữ viết Trình bày lại văn bản theo bản gốc GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  24. QUY TRÌNH SỐ HÓA TÀI LIỆU GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  25. QUY TRÌNH SỐ HÓA TÀI LIỆU Kiểm tra và Chương Xtrata Các máy Chứng thực Máy chủ Chuần bị Quét chủ trình tài liệu Server Phát tán nhận dạng chứng thực Tạo PDF Số hóa kí tự và kiểm tra Chuyển đổi Vùng định dạng chuẩn bị giấy tờ Phân loại quang học dữ liệu Chỉ tạo File giấy sửa lỗi dữ ảnh các Nhập các Phân loại Làm sạch liệu Nén các anh Tạo các nhóm File Lớp ảnh file PDF cùng loại nhập liệu Xuất dữ liệu đăng kí Mã lớp thông Xem lại thường Tạo ảnh Tổ chức các ảnh mẫu và chữ Xuất file OCR/ICR/ chứng thực file nhập OMR CSDL của các PDF và các file PDF văn bản đã Thiết lập Đọc mã Xác nhận được nhận e-mail vạch các bản gốc dạng đầy đủ QC / Quét lại GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  26. DEMO VnDocR 4.0 Accent (Demo Version) Capture 7.5 Microsoft Office Document Imaging ( MODI ) GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  27. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  28. KẾT LUẬN ĐÁNH GIÁ KẾT QUẢ HƯỚNG PHÁT TRIỂN GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  29. HƯỚNG PHÁT TRIỂN Hiện nay công nghệ này đang được Tổng Cục Thống Kê Việt Nam ứng dụng vào việc nhập số liệu cuộc Tổng điều tra Dân Số - Nhà Ở năm 2009. Việc triển khai ra sao vẫn còn là thông tin bí mật, nhưng đợt tới, Trung tâm Tin học Thống kê – Cục Thống Kê thành phố Hồ Chí Minh cần tuyển khoảng 50 người phục vụ cho việc tiến hành công nghệ này, trong tương lai, Trung tâm cần tuyển hàng trăm người để triển khai ứng dụng rộng rãi. Các phiếu điều tra dùng cho cuộc tổng điều tra năm nay được thiết kế đặc biệt, chất lượng giấy cao, trên đó có các vùng đánh dấu phục vụ cho việc quét tài liệu và xác định các vùng thông tin chính xác cần lấy. GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh
  30. CẢM ƠN CÁC THẦY CÔ VÀ CÁC BẠN ĐÃ QUAN TÂM THEO DÕI GVHD : Thầy Trần Đức Hy SVTH : Vũ Linh