Luận văn Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam

pdf 73 trang thiennha21 14/04/2022 3970
Bạn đang xem 20 trang mẫu của tài liệu "Luận văn Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfluan_van_xay_dung_quy_trinh_va_cong_cu_bien_tap_du_lieu_bien.pdf

Nội dung text: Luận văn Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam

  1. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ HOÀNG XUÂN PHƯƠNG XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN Hà Nội – 10/2020
  2. ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Hoàng Xuân Phương XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM Ngành: Hệ thống thông tin Chuyên ngành: Hệ thống thông tin Mã Số: 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. Bùi Quang Hưng Hà Nội – 10/2020
  3. i Mục lục LỜI CẢM ƠN III LỜI CAM ĐOAN IV DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT V DANH MỤC BẢNG BIỂU VI DANH MỤC HÌNH VẼ VII CHƯƠNG 1:GIỚI THIỆU 1 1.1 ĐẶT VẤN ĐỀ, ĐỊNH HƯỚNG NGHIÊN CỨU 1 1.2 MỤC TIÊU CỦA LUẬN VĂN 2 1.3 PHẠM VI NGHIÊN CỨU CỦA LUẬN VĂN 2 1.4 NỘI DUNG CỦA LUẬN VĂN 2 CHƯƠNG 2: TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ 4 2.1 NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ VIỆT NAM 4 2.1.1 Giới thiệu 4 2.1.2 Bản đồ số 7 2.1.3 Loại dữ liệu trên bản đồ số 7 2.2 DỮ LIỆU BIÊN GIỚI, ĐỊA GIỚI 9 2.2.1 Bản đồ địa hình 9 2.2.2 Biên giới 12 2.2.3 Địa giới 13 2.2.4 Bản đồ địa hình 1/50.000 14 2.2.5 Hệ quy chiếu VN2000 14 2.2.6 OSM 15 CHƯƠNG 3: XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI 16 3.1 QUY TRÌNH BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI 17 3.2 TRÍCH XUẤT DỮ LIỆU BIÊN GIỚI QUỐC GIA VÀ DỮ LIỆU ĐỊA GIỚI HÀNH CHÍNH TỪ TẬP DỮ LIỆU BẢN ĐỒ ĐỊA HÌNH 18 3.3 GỘP CÁC MẢNH BẢN ĐỒ THEO CẤP HÀNH CHÍNH: XÃ, HUYỆN, TỈNH 23 3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất: 23
  4. ii 3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp: 25 3.4 BỔ SUNG THÔNG TIN HÀNH CHÍNH CẤP HUYỆN, TỈNH 26 3.5 SỬA LỖI SAU KHI GỘP 30 3.6 CHUYỂN ĐỔI HỆ QUY CHIẾU TỪ VN2000 SANG WGS84 39 3.6.1 Tham số chuyển đổi và lưới chiếu 39 3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu: 41 3.6.3 Chuyển đổi hệ quy chiếu của dữ liệu: 43 3.7 XÂY DỰNG CÔNG CỤ CHUYỂN ĐỔI DỮ LIỆU TỪ SHAPEFILE SANG ĐƯỜNG BOUNDARIES TRÊN OSM 44 3.7.1 Cấu trúc của một tập tin tin OSM 45 3.7.2 Các bước tiền xử lý dữ liệu shapefile 47 3.7.3 Quy trình xây dựng chương trình xử lý 51 CHƯƠNG 4:KẾT QUẢ VÀ ĐÁNH GIÁ 53 KẾT LUẬN 61 TÀI LIỆU THAM KHẢO 62
  5. iii LỜI CẢM ƠN Trước tiên tôi xin dành lời cảm ơn chân thành và sâu sắc đến thầy giáo, TS. Bùi Quang Hưng – người đã hướng dẫn, khuyến khích, chỉ bảo và tạo cho tôi những điều kiện tốt nhất từ khi bắt đầu cho tới khi hoàn thành công việc của mình. Tôi xin dành lời cảm ơn chân thành tới các thầy cô giáo khoa Công nghệ thông tin, trường Đại học Công nghệ, ĐHQGHN đã tận tình đào tạo, cung cấp cho tôi những kiến thức vô cùng quý giá và đã tạo điều kiện tốt nhất cho tôi trong suốt quá trình học tập, nghiên cứu tại trường. Đồng thời tôi xin cảm ơn tất cả những người thân trong gia đình tôi cùng toàn thể bạn bè những người đã luôn giúp đỡ, động viên tôi những khi vấp phải những khó khăn, bế tắc. Cuối cùng, tôi xin chân thành cảm ơn các đồng nghiệp của tôi tại Trung tâm tích hợp liên ngành và giám sát hiện trường - FIMO đã giúp đỡ, tạo điều kiện thuận lợi cho tôi học tập và nghiên cứu chương trình thạc sĩ tại Đại học Công nghệ, ĐHQGHN. Luận văn này được hỗ trợ bởi đề tài nghiên cứu ứng dụng và phát triển công nghệ cấp quốc gia: "Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam phục vụ phát triển các ứng dụng dân sinh”, Mã số: ĐTCT-KC-4.0-03/19/25.
  6. iv LỜI CAM ĐOAN Tôi xin cam đoan rằng luận văn thạc sĩ hệ thống thông tin “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho nền tảng cung cấp dịch vụ địa chỉ Việt Nam” là công trình nghiên cứu của riêng tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận văn, những điều đã được trình bày hoặc là của chính cá nhân tôi hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các nguồn tài liệu tham khảo đều có xuất xứ rõ ràng và hợp pháp. Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan này. Hà Nội, ngày 01 tháng 10 năm 2020 Hoàng Xuân Phương
  7. v DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Thuật ngữ, khái niệm Định nghĩa Ghi chú Các từ viết tắt CSDL Cơ sở dữ liệu. OSM Open Street Map – Nền tảng bản đồ mở. NĐL Nền địa lý. GIS Geographic information system – Hệ thống thông tin địa lý. ArcMap Là một chương trình trong bộ phần mềm ArcGIS. ArcMap cho phép người sử dụng thực hiện các chức năng: hiển thị trực quan, tạo lập bản đồ, trợ giúp quyết định, trình bày, Merge Gộp 2 hoặc nhiều lớp bản đồ lại thành một lớp bản đồ duy nhất. Dissolve Chập các đối tượng kề nhau thành một đối tượng duy nhất thông qua một hoặc nhiều thuộc tính chung. VNPost Tổng công ty bưu điện Việt Nam APIs Application Programing Interface – Giao diện lập trình ứng dụng. Node Một điểm trên OSM được xác định bằng kinh độ, vĩ độ và ID. Way Được sử dụng trên OSM xác định bằng các Node để xác định các đối tượng dạng đường và ranh giới khu vực. Relation Được sử dụng trên OSM để xác định mối quan hệ giữa các đối tượng Node, Way. admin_level Được sử dụng trong OSM để xác định cấp độ của đường boundaries.
  8. vi DANH MỤC BẢNG BIỂU Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020 13 Bảng 3-1. Bảng luật topology trong ArcMap 31 Bảng 3-2. Bảng múi chiếu 40 Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ csdl địa hình 1/50.000 53 Bảng 4-2. Địa danh hành chính việt nam tính tới 01/10/2020 59
  9. vii DANH MỤC HÌNH VẼ Hình ảnh 2.1. Kiến trúc tổng thể của nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam 5 Hình ảnh.2.2. Giao diện OSM 15 Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ 16 Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam 18 Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000 19 Hình ảnh 3.4. VN2000 múi 30 cho FME 20 Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile 21 Hình ảnh 3.6. Các shapefile thu được 22 Hình ảnh 3.7. Các bước gộp dữ liệu 23 Hình ảnh 3.8. Công cụ Merge của ArcMap 24 Hình ảnh 3.9. Kết quả sau khi Merge 24 Hình ảnh 3.10. Công cụ Dissolve của ArcMap 25 Hình ảnh 3.11. Kết quả sau khi Dissolve 26 Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp 27 Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp 27 Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp 28 Hình ảnh 3.15. Join sử dụng ArcMap 29 Hình ảnh 3.16. Kết quả thu được sau khi join 30 Hình ảnh 3.18. Luật must not have gaps 36 Hình ảnh 3.19 Các vùng bị lỗi topology 37 Hình ảnh 3.20. Lỗi chồng đè giữa 2 polygon 38 Hình ảnh 3.21. Lỗi polygon không khép kín 38 Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh 39 Hình ảnh 3.23. Lý lịch bản đồ 40 Hình ảnh 3.24. Công cụ projections and transformation 41 Hình ảnh 3.25. Thiết lập tham số cho projections and transformation 42
  10. viii Hình ảnh 3.26. Thiết lập tham số cho projections and transformation 43 Hình ảnh 3.27. Chuyển đổi hệ quy chiếu 43 Hình ảnh 3.28. Kết quả sau khi chuyển đổi 44 Hình ảnh 3.29. Bảng admin boundaries của Việt Nam trên OSM 45 Hình ảnh 3.30 . Cấu trúc của một tập tin OSM 46 Hình ảnh 3.31. Polygon sang lines của QGIS 48 Hình ảnh 3.32. v.clean của QGIS 48 Hình ảnh 3.33. Trước khi sử dụng v.clean 49 Hình ảnh 3.34. Sau khi sử dụng v.clean 50 Hình ảnh 3.35. Dữ liệu gốc 50 Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean 51 Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa giới Việt Nam. 52 Hình ảnh 4.1. Nội dung trong tập tin OSM 54 Hình ảnh 4.2. Bản đồ số việt bản đồ 55 Hình ảnh 4.3. Chồng lớp nền bản đồ Việt bản đồ 56 Hình ảnh 4.4. Bản đồ số GIS Chính phủ 57 Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính phủ 58
  11. 1 CHƯƠNG 1: GIỚI THIỆU 1.1 Đặt vấn đề, định hướng nghiên cứu Đề án Phát triển Hệ tri thức Việt số hóa: Phát triển Hệ tri thức Việt số hóa, là đề án của Chính phủ Việt Nam được phê duyệt theo Quyết định số 677/QĐ-TTg[1] của Thủ tướng Chính phủ ngày 18/05/2017. Đề án có mục tiêu xây dựng một hệ tri thức tổng hợp trong mọi lĩnh vực, góp phần thúc đẩy, tạo điều kiện để mọi người dân học tập suốt đời, làm chủ tri thức, tăng cường nghiên cứu sáng tạo, ứng dụng tiến bộ khoa học công nghệ, thúc đẩy phát triển đất nước. Đề án được xây dựng và cập nhật theo hình thức xã hội hóa, thu hút và khuyến khích mọi người dân và doanh nghiệp tham gia, với vai trò vừa khai thác vừa đóng góp để làm giàu các tài nguyên tri thức số hóa của Việt Nam. Góp phần khơi dậy, lan toả niềm đam mê khoa học và công nghệ, khát vọng sáng tạo, cống hiến của mọi người trong việc tạo lập và phổ biến tri thức. Đề án hướng tới phổ cập thông tin khoa học và công nghệ cho mọi tầng lớp người dân trong xã hội, nhất là các vùng nông thôn, vùng sâu, vùng xa; học sinh, sinh viên, người lao động. Một trong những nội dung quan trọng của Đề án là Nghiên cứu xây dựng Nền tảng cung cấp dịch vụ dữ liệu địa chỉ của Việt Nam phục vụ phát triển các ứng dụng dân sinh do Đại học Quốc gia Hà Nội chủ trì. Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam sẽ là nền tảng cơ bản để trên đó các nhà phát triển xây dựng các ứng dụng dân sinh phục vụ các nhu cầu khác nhau của cộng đồng như tìm kiếm vị trí, địa điểm, địa chỉ, du lịch, văn hóa, giáo dục, y tế, Trong các công việc đó, việc xây dựng lớp dữ liệu biên giới địa giới là nhiệm vụ đầu tiên cần phải thực hiện và cũng là dữ liệu đóng vai trò cơ sở cho các lớp dữ liệu địa chỉ. Việc xây dựng dữ liệu dữ liệu bản đồ cho biên giới địa giới Việt Nam có thể được tổng hợp và biên tập từ nhiều mảnh bản đồ có các độ phân giải khác nhau, dẫn đến dữ liệu khi được tổng hợp thành một thể thống nhất sẽ có nhiều vùng bị khuyết dữ liệu hoặc các vùng không được liền mạch. Bài toán đặt ra cần phải chỉnh sửa hoặc cập nhật lại các vùng dữ liệu bị khuyết đó.
  12. 2 1.2 Mục tiêu của luận văn Đứng trước các nhu cầu cấp thiết đó tôi đã quyết định chọn đề tài “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam” làm đề tài nghiên cứu của mình. Đề tài này nhằm mục đích nghiên cứu và Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam. 1.3 Phạm vi nghiên cứu của luận văn Công việc thực hiện xây dựng quy trình và biên tập dữ liệu biên giới, địa giới tích hớp vào nền tảng cung cấp dịch vụ địa chỉ, là một công việc phức tạp yêu cầu nhiều kiến thức chuyên môn khác nhau và cần nhiều thời gian để thực hiện. Vì vậy trong luận văn này tôi chỉ tập chung chính vào một số công việc như sau: - Xây dựng quy trình gộp các mảnh bản đồ 1:50.000. - Lỗi và phương pháp xử lý lỗi khi gộp các mảnh bản đồ lại với nhau. - Xây dựng công cụ chuyển đổi dữ liệu từ dữ liệu shapefile sang định dạng tập tin OSM. - Chỉnh sửa dữ liệu tập tin OSM sau khi chuyển đổi. 1.4 Nội dung của luận văn Luận văn thực hiện xuyên suốt trong quá trình từ khi hình thành các khái niệm, ý tưởng nghiên cứu, cho đến khi xây dựng được quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam. Nội dung chính bao gồm các phần sau: • Chương 1: Mở Đầu, đặt ra vấn đề, mục tiêu và giải pháp cho bài toán “Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam”. • Chương 2: trình bày các khái niệm cơ bản phục vụ cho nghiên cứu của đề tài. • Chương 3: Quy trình và phương pháp thực hiện sẽ được trình bày trong chương này.
  13. 3 • Chương 4: Giới thiệu về công nghệ sử dụng và kết quả thực nghiệm. • Cuối cùng là phần kết luận, định hướng nghiên cứu tiếp theo.
  14. 4 CHƯƠNG 2: TỔNG QUAN VỀ DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI CHO NỀN TẢNG CUNG CẤP DỊCH VỤ ĐỊA CHỈ 2.1 Nền tảng cung cấp dịch vụ địa chỉ Việt Nam 2.1.1 Giới thiệu Luật đo đạc và bản đồ ban hành ngày 14/6/2018 và có hiệu lực từ ngày 1/1/2019[2] chỉ rõ chính sách của Nhà nước về nghiên cứu và phát triển Hạ tầng dữ liệu không gian địa lý quốc gia là tập hợp chính sách, thể chế, tiêu chuẩn, công nghệ, dữ liệu và nguồn lực nhằm chia sẻ, sử dụng hiệu quả dữ liệu không gian địa lý trong cả nước. Nội dung xây dựng hạ tầng dữ liệu không gian địa lý quốc gia bao gồm: (i) Xây dựng chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (ii) Xây dựng cơ chế, chính sách, nguồn lực để tổ chức triển khai thực hiện chiến lược phát triển, kế hoạch triển khai thực hiện hạ tầng dữ liệu không gian địa lý quốc gia; (iii) Lựa chọn và phát triển công nghệ, xây dựng tiêu chuẩn, quy chuẩn kỹ thuật về hạ tầng dữ liệu không gian địa lý quốc gia; (iv) Xây dựng, tích hợp dữ liệu không gian địa lý; (v) Xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý. Việc nghiên cứu phát triển Nền tảng dịch vụ dữ liệu địa chỉ Việt Nam có thể coi như là một nghiên cứu thử nghiệm cho việc xây dựng, vận hành Cổng thông tin không gian địa lý Việt Nam và các ứng dụng, dịch vụ dữ liệu không gian địa lý.
  15. 5 Hình ảnh 2.1. Kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam Hình trên mô tả kiến trúc tổng thể của Nền tảng cung cấp dịch vụ dữ liệu địa chỉ Việt Nam. Nền tảng này gồm các thành phần sau: ❖ Biên giới, địa giới hành chính tỉnh, huyện, xã: o Dữ liệu biên giới và địa giới hành chính toàn quốc (tỉnh, huyện, xã): sử dụng CSDL nền địa lý tỉ lệ 1:50.000 của Cục Đo đạc, Bản đồ và Thông tin địa lý Việt Nam, Bộ Tài nguyên và Môi trường. CSDL nền địa lý 1:50.000 toàn quốc đã được Trường Đại học Công nghệ, ĐHQGHN mua năm 2014 trong
  16. 6 khuôn khổ một dự án nghiên cứu về Công nghệ tích hợp liên ngành Giám sát hiện trường. ❖ Đường, phố: o Dữ liệu đường toàn quốc sử dụng các nguồn dữ liệu sau: o Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ 1:50.000 của cục đo đạc, bản đồ và thông tin địa lý Việt Nam o Dữ liệu đường của Open Street Map (OSM) [3] o Dữ liệu đường cho thành phố hà nội sử dụng các nguồn dữ liệu sau: ▪ Dữ liệu đường của csdl nền địa lý tỉ lệ 1:10.000 cho thành phố Hà Nội. ▪ Dữ liệu đường của OSM. o Dữ liệu đường cho thành phố hồ chí minh sử dụng các nguồn dữ liệu sau: ▪ Dữ liệu đường của cơ sở dữ liệu nền địa lý tỉ lệ 1:10.000 cho thành phố Hồ Chí Minh. ▪ Dữ liệu đường của OSM. ❖ Dữ liệu địa chỉ: o Cơ sở dữ liệu địa chỉ đã được thu thập được bởi tổng công ty bưu điện Việt Nam (VNPost). o Cơ sở dữ liệu địa chỉ các cơ sở giáo dục đã được thu thập bởi Bộ Giáo dục và Đào tạo. o Cơ sở dữ liệu địa chỉ các cơ sở y tế đã được thu thập bởi Bộ Y tế. o Cơ sở dữ liệu địa chỉ các cơ sở lưu trú đã được thu thập bởi Bộ Văn hóa – Thể thao – Du lịch. ❖ Các thuật toán (tìm kiếm địa chỉ, tìm đường) và quản lý, biên tập dữ liệu: o Thuật toán tìm kiếm địa chỉ (geocoding). o Thuật toán tìm đường (route planning). o Bộ công cụ quản lý và biên tập dữ liệu địa chỉ. ❖ APIs cung cấp bộ giao diên lập trình ứng dụng (application programing interface). ❖ Các ứng dụng: o Ứng dụng web cho nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam.
  17. 7 o Ứng dụng di động cho nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam (Android và iOS). o Các ứng dụng khác được phát triển dựa trên các APIs cung cấp bởi nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam. ❖ Người dùng của nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam bao gồm các nhóm sau: o Nhóm người dùng cá nhân: Các chức năng để khai thác, tìm kiếm địa chỉ, tìm đường đi cho các loại phương tiện giao thông và người đi bộ. o Nhóm chuyên gia dữ liệu địa chỉ: Các chức năng chỉnh sửa, cập nhật, kiểm tra, phân tích dữ liệu địa chỉ. o Nhóm các nhà phát triển các ứng dụng dân sinh phục vụ công tác nghiệp vụ của tổng công ty bưu điện Việt Nam và đề án hệ tri thức việt số hóa: cung cấp bộ APIs để các nhà phát triển phần mềm sử dụng trong việc xây dựng ứng dụng dân sinh. Phần trên giải thích tính cấp thiết và mô tả kiến trúc tổng quan của Nền tảng dịch cung cấp dịch vụ bản đồ Việt Nam. 2.1.2 Bản đồ số Bản đồ số là một tập hợp có tổ chức, lưu trữ các dữ liệu bản đồ trên thiết bị có khả năng đọc bằng máy tính và được thể hiện dưới dạng hình ảnh bản đồ. Bản đồ số giúp biểu diễn các trực quan về thế giới. Chúng thường thể hiện các ý tưởng tốt hơn là từ ngữ. Cách này sẽ giúp chúng ta trả lời được nhiều câu hỏi. Trường học hoặc bệnh viện nào là gần nhất? Ai là người tiếp cận với những cơ sở này khó khăn nhất? Khu vực nào là khu vực nghèo nhất? Những câu hỏi đó có thể được thể hiện tốt nhất thông qua các bản đồ và bản đồ có thể trả lời cho những câu hỏi như vậy. Bản đồ số hàm chứa nhiều thông tin. Bên cạnh đó bản đồ số có thể mô tả thông tin cho các đối tượng khác nhau ở những khu vực khác nhau, giải quyết các vấn đề của cộng đồng, hoặc đơn thuần là giúp ai đó tìm đường đi. 2.1.3 Loại dữ liệu trên bản đồ số Bản đồ số lưu theo loại đối tượng dưới đây:
  18. 8 - Điểm (Points): Đối tượng đơn có vị trí. Ví dụ: Trường học, hiệu thuốc, nhà hàng, - Đường (Arcs): Các đối tượng dạng tuyến. Ví dụ: đường sá, sông, đường tàu, - Vùng (Polygons): Vùng có diện tích, định nghĩa bởi đường bao. Ví dụ thửa loại đất Để phản ánh toàn bộ các thông tin cần thiết của bản đồ dưới dạng đối tượng số, các đối tượng địa lý còn được phản ánh theo cấu trúc phân mảnh và phân lớp thông tin. Cấu trúc phân mảnh: Một đối tượng địa lý về mặt không gian có thể liên tục trên một phạm vi rộng. Tuy nhiên trong cơ sở dữ liệu GIS, do hạn chế về các lý do kỹ thuật như khả năng lưu trữ, xử lý, quản lý dữ liệu mà các đối tượng địa lý lưu trữ dưới dạng cách mảnh (mapsheet, tile). Tuy nhiên khái niệm chia mảnh trong cơ sở dữ liệu GIS không hoàn toàn đồng nhất với khái niệm chia mảnh bản đồ thông thường. Một mảnh (tile) trong cơ sở dữ liệu GIS có thể có hình dạng bất kỳ miễn sau cho phù hợp với khả năng quản lý và xử lý của hệ thống. Trong một số hệ thống GIS đã có, người dùng phải tự quản lý cách chia mảnh của mình. Tuy nhiên xu hướng hiện nay, các hệ thống GIS đã cung cấp những công cụ cho phép người sử dụng tự động quản lý các mảnh trong cơ sở dữ liệu. Một số GIS tiến bộ hơn, dựa trên các kỹ thuật mới của công nghệ hướng đối tượng, về mặt vật lý, các đối tượng địa lý bị chia cắt theo từng mảnh, nhưng đối với người sử dụng, các đối tượng là liên tục không bị chia cắt. Cấu trúc phân lớp thông tin: Một trong những bước quan trọng xây dựng cơ sở dữ liệu GIS là phân loại các lớp thông tin (layer, class). Hệ thống GIS lưu trữ các đối tượng địa lý theo các lớp thông tin. Mỗi lớp thông tin lưu trữ một loại các đối tượng có chung một tính chất, đặc điểm giống nhau. Thiết kế các lớp thông tin rất quan trọng đối với bất kỳ một hệ thống GIS nào. Cách phân lớp thông tin sẽ ảnh hưởng rất lớn đến tính hiệu quả, khả năng xử lý và sử dụng lâu dài của cơ sở dữ liệu không gian. Một số nguyên tắc khi thiết kế các lớp thông tin:
  19. 9 ❖ Có các lớp thông tin cơ bản: các ứng dụng khác nhằm cần đến những lớp thông tin cơ bản (thông tin nền) Ví dụ như: - Lớp thông tin cơ sở toán học bản đồ: điểm khống chế, khung, điểm độ cao, trắc địa nhà nước, - Lớp thông tin về địa hình - Lớp thông tin về hệ thống thuỷ văn - Lớp thông tin về hệ thống đường giao thông ❖ Đủ các lớp thông tin chuyên đề: Tuỳ từng ứng dụng và yêu cầu cụ thể trước mắt, việc chọn lựa các lớp thông tin chuyên đề được lưu trữ trong cơ sở dữ liệu và thứ tự nhập vào là quan trọng. Nó ảnh hưởng trực tiếp đến giá thành và thời gian xây dựng cơ sở dữ liệu GIS 2.2 Dữ liệu biên giới, địa giới Các dữ liệu về biên giới địa giới trong luận văn này sẽ được biên tập dựa trên dữ liệu bản đồ địa hình 1:50.000 của Việt Nam. 2.2.1 Bản đồ địa hình Bản đồ địa hình: Là loại bản đồ chuyên đề có tỉ lệ: 1:1.000.000 hoặc lớn hơn trên bản đồ, địa hình và địa vật một khu vực bề mặt trái đất được thể hiện một cách chính xác và chi tiết bằng hệ thống các qui ước ký hiệu thích hợp. Ví dụ: Địa hình rừng núi, sông suối, biển; Địa vật nhứ nhà máy – sân bay – bến cảng nhà ga, đình, chùa, cây to độc lập. Ý nghĩa của bản đồ địa hình: Bản đồ địa hình trong đời sống xã hội có một ý nghĩa rất to lón trong việc giải quyết các vấn đề khoa học và thực tiễn, nhũng vấn đề có liên quan đến nghiên cứu địa hình, lợi dụng địa hình để tiến hành thiết kế, xây dựng các công trình trên thực địa. Trong quân sự: Bản đồ địa hình giúp người chỉ huy nắm chắc các yếu tố để chỉ đạo tác chiến trên đất liền, trên biển và trên không. Trong thực tế không phải lúc nào cũng ra thực địa để quan sát trực tiếp bằng mắt. Tuy có cụ thể hơn chính xác hơn nhưng rất hạn chế về tầm nhìn, do tính chất của địa hình, do tình hình địch v.v
  20. 10 chính vì vậy bản đồ địa hình là phương tiện không thể thiếu của người chỉ huy. Phân loại đặc điểm, công dụng của bản đồ địa hình: Trong phân loại thông thường bản đồ được phân ra 2 loại: - Bản đồ địa lý cơ bản. - Bản đồ chuyên dùng: quân sự, kinh tế, văn hóa, xã hội, khoáng sản, Đặc điểm khung bản đồ và ghi chú xung quanh: Khung bản đồ: dùng để trang trí bản đồ, là những đường giới hạn diện tích của mỗi mảnh bản đồ. Khung bản đồ được gọi tên khung bắc, nam, đông, tây. Ghi chú xung quanh khung bản đồ: nhằm thuyết minh giải thích cho người sử dụng bản đồ biết cách gọi tên và sử dụng các ký hiệu trên bản đồ. Về nguyên tắc ghi chú xung quanh của bản đồ Gauss và bản đồ UTM về cơ bản giống nhau chỉ khác cách sắp xếp vị trí, cách ghi, cách trình bày (hiện nay thống nhất cả nước ta sử dụng bản đồ theo phép chiếu Gauss). - Khung bắc: ghi tên bản đồ, ghi địa danh hành chính cấp cao nhất được thể hiện trong bản đồ, hoặc địa danh nổi tiếng trong vùng dân cư dưới tên bản đồ ghi số hiệu của mảnh bản đồ (xác định mảnh bản đồ này nằm ở vị trí nào trên trái đất). - Bên trái tên bản đồ ghi tên vị trí địa chỉ 1 khu vực, địa chỉ tổng quát 1 huyện, 1 tỉnh. - Khung nam: ghi tỷ lệ số, tỷ lệ thước, tỷ lệ chữ, phía dưới tỷ lệ chữ ghi chú khoảng cao đều của đường biên độ cơ bản, tùy theo tỷ lệ bản đồ mà ghi chú này thay đổi – lược đồ bản chắp: giúp người sử dụng biết các mảnh bản đồ cần chắp với các mảnh bản đồ đang dùng. - Tiếp theo là phần chỉ dẫn các ký hiệu giúp người sử dụng tra cứu khi sử dụng bản đồ. Cơ sở toán học của bản đồ địa hình: Tỉ lệ bản đồ: là yếu tố toán học quan trọng để xác định mức độ thu nhỏ, độ dài khi chuyển từ mặt cong của trái đất lên mặt phẳng của bản đồ; là tỷ số
  21. 11 giữa độ dài trên bản đồ và độ dài ngoài thực địa; là mức độ thu nhỏ chiều dài nằm ngang của các đường trên thực địa khi biểu thị chúng trên bản đồ. Tỷ lệ bản đồ được biểu diễn dưới dạng phân số 1/M (Tử số là độ dài trên bản đồ, M là độ dài trên thực địa). Tỉ lệ bản đồ được biểu diễn dưới 3 dạng - Tỉ lệ số: tỉ lệ dạng phân số, ví dụ 1: 50.000; 1/50.000 - Tỉ lệ chữ: thường được ghi rõ dưới khung nam bản đồ, ví dụ: 1cm bằng 500m ngoài thực địa (bản đồ tỉ lệ 1: 50.000) - Tỉ lệ thước: trên mỗi tờ bản đồ đều có một thước tỉ lệ thẳng đã tính ra cự ly thực địa. Phép chiếu: Hiện tại ta có hai phép chiếu để thể hiện trái đất lên mặt bản đồ. - Phép chiếu GAUSS của nhà bác học người Đức - Phép chiếu UTM của quân đội Mỹ. Cả hai phép chiếu là cách chiếu hình kinh tuyến và vĩ tuyến từ mặt trái đất lên mặt phẳng giấy bằng phương pháp toán học (hiện tại ta thống nhất sử dụng bản đố theo phương pháp chiếu GAUSS). Cách chia mảnh và ghi số bản đồ: Tùy theo phương pháp chiếu đồ để thực hiện việc chia mảnh và ghi số hiệu bản đồ. Theo phương pháp chiếu Gauss: - Bản đồ tỷ lệ 1:1.000.000: ▪ Chia mặt trái đất thành 60 dải chiếu đồ đánh số thứ tự từ 1 – 60. Dải số 1 từ 180 độ đến 174 độ tây và tiến dần về phía đông đến dải số 60 mỗi dải cách nhau 6 độ. Việt Nam nằm ở dải số 48 và 49. ▪ Chia dải chiếu đồ theo vĩ độ từng khoảng 4 độ kể từ xích đạo trở lên phía Bắc cực và xuống Nam cực, đánh thứ tự A, B, C, D, tính từ xích đạo. Việt Nam thuộc 4 khoảng C, D, E, F. ▪ Mổi hình thang cong (6 độ vĩ tuyến và 4 độ kinh tuyến) là khuôn khổ một mảnh bản đồ tỷ lệ 1:1000.000
  22. 12 ▪ Dùng cặp chữ trước số sau để ghi số hiệu cho một mảnh bản đồ. Hà Nội nằm ở mảnh F- 48. - Bản đố tỷ lệ: 1:100.000: ▪ Chia mảnh bản đồ tỷ lệ 1.000.000 thành 144 ô nhỏ, mổi ô dọc 20’ ngang 30’ là khuôn khổ một mảnh bản đồ tỷ lệ 1:100.000. ▪ Số hiệu đánh từ 1 – 144 (từ trái qua phải, từ trên xuống dưới) ghi vào sau số hiệu mảnh bản đồ tỷ lệ 1:1000.000. ▪ Ví dụ: F – 48 – 116. - Bản đồ tỷ lệ: 1:50.000 ▪ Chia mảnh bản đồ tỷ lệ 1: 100.000 thành 4 ô nhỏ mỗi ô dọc 10’ ngang 15’ đánh số A, B, C, D (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 100.000 Ví dụ: F48 – 116 – B. - Bản đồ tỷ lệ: 1:25.000: ▪ Chia mảnh bản đồ tỷ lệ 1: 50.000 thành 4 ô nhỏ mỗi ô dọc 5’ ngang 7’ 30’’ đánh số a, b, c, d (từ trái qua phải từ trên xuống dưới), ghi sau số hiệu mảnh bản đồ tỷ lệ 1: 50.000 Ví dụ: F48 – 116 – B - a. Bản đồ, lưới toạ độ quốc gia và các trạm GPS là những tài liệu điều tra cơ bản được xây dựng theo chuẩn thống nhất, đảm bảo cung cấp thông tin nhanh, chính xác cho mọi hoạt động quản lý nhà nước, phát triển kinh tế, xã hội, bảo vệ đất nước, nghiên cứu khoa học 2.2.2 Biên giới Đường biên giới Quốc gia được xác định rất rõ, nó là hàng rào pháp lý xác định giới hạn vùng đất, vùng nước, vùng biển, vùng trời và lòng đất thuộc chủ quyền quốc gia; là nới phân chia chủ quyền lãnh thổ của một quốc gia này với một quốc gia khác và hoặc với các vùng biển thuộc quyền chủ quyền và quyền tài phán của quốc gia đó. Nước ta có đường biên giới đất liền dài 4.516 km, tiếp giáp với 3 nước láng giềng (Trung Quốc, Lào, Căm-pu- chia); có bờ biển dài khoảng 3.260 km. Nói một cách khác, đường biên giới quốc gia chính là giới hạn ngăn cách lãnh thổ quốc gia này với quốc gia khác, ngăn cách lãnh hải với vùng đặc quyền kinh tế và thềm lục địa của một quốc gia.
  23. 13 Trong điều 1, Luật Biên giới quốc gia năm 2003 của ta nêu rõ “Biên giới quốc gia của nước Cộng hoà xã hội chủ nghĩa Việt Nam là đường và mặt thẳng đứng theo đường đó để xác định giới hạn lãnh thổ đất liền, các đảo, các quần đảo trong đó có quần đảo Hoàng Sa và Trường Sa, vùng biển, lòng đất, vùng trời của nước Cộng hoà xã hội chủ nghĩa Việt Nam. Trong nội dung luận văn này về phần xác định đường biên giới Quốc gia chỉ giới hạn với vùng biên giới trên đất liền. 2.2.3 Địa giới Địa giới hành chính là đường ranh giới phân chia các đơn vị hành chính, là cơ sở pháp lý phân định phạm vi trách nhiệm của bộ máy hành chính nhà nước trong việc quản lý dân cư, đất đai, kinh tế, chính trị, văn hóa, xã hội ở địa phương. Địa giới hành chính được xác định bằng các mốc giới cụ thể, thể hiện tọa độ của vị trí đó. Việt Nam có 4 cấp hành chính đó là: cấp trung ương, cấp tỉnh, cấp huyện và cấp xã. Địa giới hành chính chỉ được xác lập ở 3 cấp: tỉnh, huyện, xã. Mỗi địa giới hành chính là một thực thể trong nền hành chính Nhà nước. Mỗi đơn vị địa giới hành chính cần phải được xác định cụ thể về: địa lý, dân cư. Trong quản lý của nhà nước cần phải xác định rõ không gian tác động của hoạt động quản lý. Hay nó cách khác với mỗi đơn vị địa giới hành chính cần phải được xác định rõ giới hạn và không gian, địa bàn cụ thể. Bảng 1. Số lượng đơn vị địa giới hành chính tính đến 01/10/2020(1) STT Nội dung Tổng số 1 Cấp tỉnh 63 Tỉnh 58 Thành phố trực thuộc Trung ương 5 Cấp huyện 707 2 Thành phố 77 Thị xã 49 Quận 49 1.
  24. 14 Huyện 532 Cấp xã 10.614 3 Xã 8.324 Phường 1.680 Thị trấn 610 Chính vì thế, các đơn vị hành chính cấp xã, cấp huyện, cấp tỉnh cần xác định rõ “đường biên” hay “ranh giới” và được lưu trữ quản lý. 2.2.4 Bản đồ địa hình 1/50.000 Bản đồ địa hình 1/50.000[3] của Việt Nam: Bộ bản đồ địa hình phủ trùm toàn bộ lãnh thổ Viêt Nam gồm 740 mảnh trong đó gồm: 573 mảnh bản đồ số, 98 mảnh bản đồ địa hình biên giới Việt - Lào, Việt Nam - Trung Quốc, và 69 mảnh bản đồ địa hình đáy biển. Các mảnh bản đồ số này bao gồm 7 tập tin cho phép người sử dụng có thể tìm hiểu thông tin về cơ sở toán học, thủy hệ, địa hình, giao thông, dân cư, ranh giới, thực vật và có thể tạo mô hình không gian 3 chiều cho bề mặt địa hình. 2.2.5 Hệ quy chiếu VN2000 Theo nội dung của thông tư 973/2001/TT-TCĐC[4] của Tổng cục Địa chính: hệ quy chiếu và Hệ toạ độ quốc gia VN-2000 (gọi tắt là VN-2000) được áp dụng thống nhất để xây dựng hệ thống toạ độ các cấp hạng, hệ thống bản đồ địa hình cơ bản, hệ thống bản đồ nền, hệ thống bản đồ địa chính, hệ thống bản đồ hành chính quốc gia và các loại bản đồ chuyên đề khác. Trong hoạt động đo đạc và bản đồ chuyên dụng, khi cần thiết được áp dụng các hệ quy chiếu khác phù hợp với mục đích riêng. Các tham số được sử dụng trong VN2000: - Ellipsoid quy chiếu quốc gia là ê-líp-xô-ít WGS-84 toàn cầu với kích thước: ▪ Bán trục lớn: a = 6378137,0m ▪ Độ dẹt: f = 1: 298,257223563 ▪ Tốc độ góc quay quanh trục:  = 7292115,0x10-11 rad/s ▪ Hằng số trọng trường Trái đất: GM= 3986005.108m3s-2
  25. 15 - Vị trí Ellipsoid quy chiếu quốc gia: Ellipsoid WGS-84 toàn cầu được xác định vị trí (định vị) phù hợp với lãnh thổ Việt Nam trên cơ sở sử dụng điểm GPS cạnh dài có độ cao thuỷ chuẩn phân bố đều trên toàn lãnh thổ. - Điểm gốc toạ độ quốc gia: Điểm N00 đặt tại Viện Nghiên cứu Địa chính thuộc Tổng cục Địa chính, đường Hoàng Quốc Việt, Hà Nội. 2.2.6 OSM OpenStreetMap[5] được viết tắt OSM là một dự án cộng đồng, với mục đích tạo ra một bản đồ thế giới miễn phí và bất cứ ai đều có thể tham gia đóng góp hoặc chỉnh sửa dữ liệu. Với việc thuận tiện và dễ dàng tham gia đóng góp xây dựng bản đồ, nên mỗi ngày có hàng ngàn tình nguyện viên tích cực tham gia đóng góp để cải thiện chất lượng bản đồ. Các thành viên tình nguyện có thể tham gia đo vẽ dữ liệu đường phố, các điểm tiện ích quan tâm (POI) và một số thông tin địa lý liên quan. Toàn bộ dữ liệu được chia sẻ và cho phép tất cả những ai có nhu cầu tải về tại www.openstreetmap.org để phục vụ cho mục đích riêng của mình mà không phải trả bất kì khoản phí nào cả. Ngoài ra dữ liệu từ OSM còn được dùng trong một số ứng dụng thương mại và miễn phí trên các nền tảng. Hình ảnh.2.2. Giao diện OSM
  26. 16 CHƯƠNG 3: XÂY DỰNG QUY TRÌNH VÀ CÔNG CỤ BIÊN TẬP DỮ LIỆU BIÊN GIỚI ĐỊA GIỚI Dữ liệu biên giới địa giới của nền tảng cung cấp dịch vụ địa chỉ được biên tập từ dữ liệu bản đồ địa hình. Dữ liệu sau khi được biên tập và chuẩn hóa sẽ được nạp vào trong CSDL, từ dữ liệu đó sẽ đóng vai trò cho việc xuất bản dịch vụ bản đồ nền về ranh giới địa giới Việt Nam. Và đóng vai trò cung cấp thông tin bổ sung cho các API truy vấn về sau. Hình ảnh 3.1. Kiến trúc tổng quan của nền tảng cung cấp dịch vụ địa chỉ
  27. 17 3.1 Quy trình biên tập dữ liệu biên giới địa giới Bản đồ địa hình Việt Nam 1/50.000 thuộc hệ thống bản đồ địa hình quốc gia, được thành lập cho phần đất liền, phần hải đảo và thềm lục địa của Việt Nam trong hệ quy chiếu và hệ tọa độ quốc gia VN-2000, hệ độ cao quốc gia Việt Nam. Các mảnh bản đồ địa hình gốc dạng số được lưu trữ dưới dạng MicroStation (*.dgn). Quy trình biên tập dữ liệu biên giới địa giới được thực hiện từ việc chuyển đổi dữ liệu thô đến bước xây dựng công cụ chuyển đổi và bổ sung thông tin vào dữ liệu kết quả. Để biên tập dữ liệu biên giới địa giới của Việt Nam sẽ được thực hiện thông qua các bước như sau: - Bước 1: Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới hành chính từ tập dữ liệu bản đồ địa hình. - Bước 2: Gộp các mảnh mảnh bản đồ theo cấp hành chính: xã, huyện, tỉnh - Bước 3: Sửa lỗi sau khi gộp - Bước 3: Bổ sung thông tin hành chính cấp tỉnh, cấp huyện vào ranh giới hành chính cấp xã. - Bước 4: Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84. - Bước 5: Chuyển đổi dữ liệu từ shapefile sang tập tin OSM thông qua công cụ chuyển đổi.
  28. 18 Hình ảnh 3.2. Các bước biên tập dữ liệu biên giới địa giới của Việt Nam Nội dung các bước thực hiện sẽ được trình bày chi tiết ở các mục tiếp theo. 3.2 Trích xuất dữ liệu biên giới quốc gia và dữ liệu địa giới hành chính từ tập dữ liệu bản đồ địa hình Bản đồ địa hình 1/50.000 là các tập tin dữ liệu MicroStation gồm các dữ liệu về vị trí và hình học của các đối tượng đia lý và các thông tin khác có liên quan tới đối tượng địa lý đó. Mỗi một mảnh dữ liệu địa hình 1/50.000 bao gồm các lớp dữ liệu sau: - Cơ sở đo đạc - Biên giới địa giới - Địa hình - Thủy hệ
  29. 19 - Giao thông - Dân cư cơ sở hạ tầng - Phủ bề mặt Hình ảnh 3.3. Cấu trúc dữ liệu của bản đồ địa hình 1/50.000 Trong nội dung của luận văn này tác giả chỉ sử dụng lớp dữ liệu biên giới địa giới. Định dạng tập tin *.DGN là tên được sử dụng cho các định dạng tập tin CAD hỗ trợ bởi Bentley Systems, chương trình MicroStation CAD. Định dạng DGN được sử dụng trong các dự án xây dựng, bao gồm các tòa nhà, đường cao tốc, cầu cống, nhà máy xử lý, đóng tàu. DGN là một định dạng cạnh tranh để DWG của Autodesk. Định dạng shapefile (SHP) là một định dạng dữ liệu vector không gian địa lý cho hệ thống thông tin địa lý phần mềm (GIS). Nó được phát triển và quy định của ESRI như một đặc điểm kỹ thuật chủ yếu là mở cửa cho khả năng tương tác dữ liệu giữa các ESRI và các sản phẩm phần mềm GIS khác. Định dạng shapefile không gian có thể mô tả các tính năng vector: điểm,
  30. 20 đường và đa giác, đại diện, ví dụ, giếng nước, sông, hồ. Mỗi mục thường có thuộc tính mô tả nó, chẳng hạn như tên hoặc nhiệt độ. Để thực hiện chuyển đổi dữ liệu bản đồ địa hình sang shapefile trong luận văn này tác giả sử dụng phần mềm FME[6]. FME hỗ trợ chuyển đổi nhanh định dạng các tập tin địa lý. Do dữ liệu gốc ở hệ quy chiếu VN2000 múi 30 nhưng trong hệ chuyển đổi của FME không có, do vậy trước khi chuyển đổi dữ liệu cần thiết lập cho FME hỗ trợ chuyển đổi đối VN2000 múi 30. Mở tập tin cấu hình MyCoordSysDefs.fme bổ sung thêm config VN2000 múi 30 như sau: Hình ảnh 3.4. VN2000 múi 30 cho FME Sau khi đã thêm thiết lập cho FME sẽ tiến hành chuyển đổi dữ liệu MicroStation bằng công cụ Quick Translation của FME như sau:
  31. 21 Hình ảnh 3.5. Chuyển đổi dữ liệu sang shapefile Dữ liệu đầu vào sẽ bao gồm: - Format: Bentley MicroStation Design (V7) - Dataset: Đường dẫn tới tập tin dữ liệu cần chuyển đổi - Coord.System: VN2000-105-Mui_3do - Output Format: Lựa chọn Esri Shapefile Kết quả sau khi chuyển đổi từ tập tin dữ liệu MicroStation sang shapefile sẽ thu được các tập tin shapefile bao gồm: DiaPhanTinh, DiaPhanHuyen, DiaPhanXa, MocBienGioi.
  32. 22 Hình ảnh 3.6. Các shapefile thu được Từ các shapefile thu được sẽ được tiền xử lý qua các công cụ ArcMap[7][8], QGIS[9][10][11], JOSM[12][13] để giúp tăng chất lượng dữ liệu hoặc chuyển đổi qua các định dạng có thể xử lý về sau.
  33. 23 3.3 Gộp các mảnh bản đồ theo cấp hành chính: xã, huyện, tỉnh Kết thúc quá trình chuyển đổi định dạng dạng dữ liệu sẽ thu được 740 mảnh dữ liệu ranh giới cấp xã, 740 mảnh dữ liệu ranh giới cấp huyện, 740 mảnh dữ liệu cấp tỉnh. Từ các mảnh dữ liệu đó tác giả sẽ thực hiện các bước sau: - Gộp các mảnh rời rạc lại thành một mảnh thống nhất - Loại bỏ đường chia cắt giữa các mảnh sau khi gộp - Sửa lỗi sau khi gộp - Bổ sung thông tin hành chính sau khi gộp Hình ảnh 3.7. Các bước gộp dữ liệu 3.3.1 Gộp các mảnh rời rạc lại thành một mảnh thống nhất: Để gộp các mảnh bản đồ ranh giới cấp xã lại thành một mảnh thống nhất sử dụng công cụ Merge của ArcMap[14]
  34. 24 Hình ảnh 3.8. Công cụ Merge của ArcMap Kết quả sau khi sau khi Merge các mảnh dữ liệu lại với nhau sẽ bao gồm các polygon ranh giới, thông tin của từng đơn vị xã/phường/thị trấn và đường phân chia của các mảnh: Hình ảnh 3.9. Kết quả sau khi Merge Bước kế cần phải thực hiện loại bỏ các đường phân chia của các mảnh.
  35. 25 3.3.2 Loại bỏ đường chia cắt của các mảnh sau khi gộp: Để loại bỏ các đường phân chia của các mảnh sau khi gộp thông qua công cụ Dissolve của ArcMap. Hình ảnh 3.10. Công cụ Dissolve của ArcMap Kết quả sau khi thực hiên Dissolve các đường viền phân chia của các mảnh dữ liệu đã được loại bỏ.
  36. 26 Hình ảnh 3.11. Kết quả sau khi Dissolve Đối với các mảnh dữ liệu cấp huyện và cấp tỉnh cũng thực hiện các bước tương tự. 3.4 Bổ sung thông tin hành chính cấp huyện, tỉnh Kết thúc quá trình gộp dữ liệu sẽ thu được 3 shapefile về ranh giới địa giới cho cấp xã, cấp huyện và cấp tỉnh. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp
  37. 27 Hình ảnh 3.12. Bảng dữ liệu của ranh giới địa giới cấp xã sau khi gộp Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp Hình ảnh 3.13. Bảng dữ liệu của ranh giới địa giới cấp huyện sau khi gộp Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp
  38. 28 Hình ảnh 3.14. Bảng dữ liệu của ranh giới địa giới cấp tỉnh sau khi gộp Sau khi đã có các shapefile như trên, bước tiếp theo cần thêm các trường thông tin mã đơn vị hành chính (MDVHC) cấp huyện, tên huyện, mã đơn vị hành chính cấp tỉnh và tên tỉnh vào từng bản ghi một của shapefile ranh giới địa giới cấp xã. Để có thể thực hiện việc thêm thông tin từ shapefile ranh giới địa giới cấp huyện, cấp tỉnh vào cấp xã cần sử dụng công cụ Join trên ArcMap với thiết lập như trong hình bên dưới để thực hiện việc Join giữa 2 shapefile dựa trên không gian của các polygon:
  39. 29 Hình ảnh 3.15. Join sử dụng ArcMap Sau khi Join xong và loại bỏ những trường không cần thiết sẽ thu được một shapefile có cấu trúc như sau:
  40. 30 Hình ảnh 3.16. Kết quả thu được sau khi Join 3.5 Sửa lỗi sau khi gộp Sau khi hoàn thiện việc gộp các mảnh bản đồ sẽ có một số lỗi ngoại lệ xuất hiện trên bản đồ cần phải sửa lại. Các lỗi gặp phải là những lỗi liên quan đến liên kết không gian trong Polygon hay còn gọi là những lỗi liên quan đến Topology. Quan hệ không gian Topology trong GIS là mối quan hệ logic giữa vị trí của các đối tượng. Cấu trúc dữ liệu thuộc Topology cung cấp một cách tự động hóa để xử lý việc số hóa, xử lý lỗi; giảm dung lượng lưu trữ dữ liệu cho các vùng vì các ranh giới giữa những vùng nằm kề nhau được lưu trữ chỉ một lần; và cho phép chúng ta cấu trúc dữ liệu dựa trên các nguyên lý về tính kề cận (adjacency) và kết nối (connectivity) để xác định các quan hệ không gian. Ngoài ra Topology là mô hình được sử dụng để mô tả làm thế nào các đối tượng chia sẻ hình học với nhau. Và cũng là cơ chế để xây dựng và duy trì quan hệ Topology giữa các đối tượng. ArcGIS thực thi quan hệ Topology thông qua một tập các quy tắc định nghĩa các đối tượng chia sẻ hình học với nhau theo cách nào và một tập các công cụ chỉnh sửa các đối tượng vi phạm quy tắc đề ra. Một số lỗi gặp phải sau khi gộp bao gồm: - Đường phân chia ranh giới giữa các mảnh chưa mất - Polygon không kín
  41. 31 - 2 Polygon bị chồng đè - Xuất hiện vùng chống giữa polygon Sử dụng công cụ Topology trên ArcMap để validate và sửa lỗi dữ liệu, thiết lập các luật cho Topology để ArcMap để kiểm tra các lỗi có trong dữ liệu. Bảng 3-1. Bảng luật Topology trong ArcMap[15] Luật topology Mô tả Sử dụng Minh hoạ Phải lớn hơn Trong trường hợp Vùng luật này bị vi phạm, dung sai phần bên trái của cluster hình ban đầu sẽ không bị thay đổi. Các đỉnh vi phạm luật (must be Luật này là bắt buộc này được xác định là larger trong một topology không trùng khớp và tolerance) và có thể áp dụng cho được bắt vào nhau. tất cả các lớp đối Dung sai cluster: là tượng địa lý vùng khoảng cách nhỏ nhất giữa 2 đỉnh của đối tượng địa lý. Phải không Qui định bên trong Vùng các vùng trong lớp chồng xếp đối tượng địa lý là (Must not không chồng xếp. Các vùng có thể Luật này có ích trong overlap) chung các cạnh hoặc việc mô hình hóa ranh đỉnh. giới hành chính, khu vực bầu cử và phân loại khu vực riêng như khu bầu cử không được che phủ trên vùng bao khu.
  42. 32 Phải không có Luật qui định rằng Vùng khoảng trống không có bất kì không có khoảng trống nào bên khoảng (Must not trong một vùng hoặc trống hanve gaps) giữa các vùng liền kề. Các vùng đất không Tất cả các vùng phải thể bao gồm khoảng trải trên một bề mặt trống. Do vậy các đa lên tục. Sẽ luôn tồn giác phải bao phủ toàn tại lỗi trên biên ngoài bộ khu vực. của vùng. Phải không Qui định rằng trong Hai vùng một lớp đối tượng địa trong hai chồng xếp với lý không được chồng lớp đối ( Must not xếp với vùng trong tượng địa lớp đối tượng địa lý lý khác overlap vith) Lỗi được tạo ra tại vị khác. Hai vùng có thể nhau. trí các đa giác của hai cùng các cạnh, các lớp đối tượng địa lý đỉnh hoặc rời rạc chồng xếp. hoàn toàn. Luật này có ích khi chồng xếp Lớp sông hồ và lớp đất 2 hệ thống riêng biệt trồng là 2 lớp đối với nhau của phân tượng địa lý khác nhau loại vùng. do đó 2 lớp không được chồng xếp. Phải được che Qui định một vùng Hai vùng phủ bởi lớp đối trong một lớp đối trong 2 tượng địa lý tượng địa lý phải có diện tích hoàn toàn lớp đối (Must be được che phủ trong Lỗi vùng được tạo ra covered by tượng địa vùng của lớp đối với đa giác trong lớp feature class of) lý tượng địa lý khác. đối tượng địa lý đầu khác tiên tại vị trí không nhau được che phủ. Quận phải được che phủ bởi các phường.
  43. 33 Phải che phủ Qui định các vùng Hai vùng của một lớp đối trong hai lẫn nhau tượng địa lý phải lớp đối (Must cover được chi phủ hoàn tượng địa toàn trùng khít với lý khác each other) Tất cả các đa giác vùng của lớp đối nhau trong lớp đối tượng địa tượng địa lý khác. lý đầu tiên và tất cả Các đa giác có thể các đa giác trong lớp chung cạnh hoặc đối tượng địa lý thứ 2 đỉnh. Luật này được phải được che phủ lẫn sử dụng khi 2 hệ nhau thống phân loại được sử dụng cho cùng khu Thực vật và đất trồng vực địa lý. Do đó, bất phải được che phủ lẫn kỳ điểm nào được xác nhau. Luật cũng có thể định trong một hệ được áp dụng với các thống cũng phải được lớp đối tượng địa lý xác định trong hệ không phân cấp như thống kia và hai lớp kiểu đất trồng và đối tượng địa lý che lớpđộ dốc. phủ cùng khu vực như nhau. Phải được che Qui định vùng của Hai vùng phủ bởi một lớp đối tượng địa trong hai lý phải được che phủ lớp đối (Must be coverd bên trong vùng của tượng địa by) lớp đối tượng địa lý lý khác khác. Các đa giác có nhau Lỗi vùng được tạo ra thể chung các cạnh trên vùng trong lớp đối hoặc đỉnh. tượng địa lý đầu tiên không được che phủ Luật này sử dụng bởi vùng trong lớp đối trong việc mô hình tượng địa lý thứ 2. hoá các vùng là tập con của một vùng bao quanh rộng lớn,
  44. 34 chẳng hạn như quản lý các cụm cây trong rừng hoặc các khối nhà trong khu nhà. Đường biên Qui định đường biên Hai vùng phải được che của các đối tượng địa trong hai phủ bởi đường lý vùng trong một lớp lớp đối biên đối tượng địa lý phải tượng địa được che phủ bởi lý khác (Area boundary đường biên của các nhau Lỗi xảy ra trên đường must be coverd đối tượng địa lý vùng biên vùng trong lớp trong lớp đối tượng đối tượng địa lý đầu by boundary of) địa lý khác. tiên không được che phủ bởi đường biên Luật này được sử vùng trong lớpdt còn dụng khi đối tượng lại. địa lý vùng trong một lớp bao gồm nhiều Ví dụ: áp dụng trong vùng trong lớp khác. trường hợp các vùng và đường bao cần thành hang. Đường bao phải Qui định đường biên Vùng và được che phủ của các đối tượng địa đường bởi. lý vùng phải được thẳng che phủ bằng các trong hai Lỗi được tạo ra trên (Boundary đường thẳng trong lớp đối các đường biên vùng Must be lớp đối tượng địa lý tượng địa không được phủ bởi khác. lý khác covered by) đường thẳng của lớp nhau. Sử dụng khi đường đối tượng địa lý kia. biên các đối tượng Ví dụ: đường biểu diễn địa lý vùng được phần đường biên khối đánh dấu và đường điều tra dân số. thẳng có tập thuộc tính là khác nhau.
  45. 35 Bao gồm điểm Qui định một vùng Vùng và trong một lớp đối điểm tượng địa lý chứa ít trong 2 nhất một điểm của lớp đối tượng địa lý đối tượng khác. Các điểm phải địa lý nằm trong đa giác và không nằm trên khác nhau. Lỗi được tạo ra trên đường bao. các vùng không chứa Luật sử dụng khi mọi ít nhất một điểm. vùng cần có ít nhất Ví dụ: các thửa đất một điểm liên kết. phải chứa ít nhất 1 Một điểm trên đường điểm tâm thửa. bao vùng không được coi là chứa trong vùng đó. Khi chồng xếp các vùng, các đa giác có thể chung 1 điểm trong vùng chồng xếp. Ở trong trường hợp này tác giả sử dụng 2 luật: - Must Not Overlap
  46. 36 Hình ảnh 3.17. Luật Must Not Overlap - Must Not Have Gaps Hình ảnh 3.18. Luật Must Not Have Gaps Kết quả sau khi kiểm tra
  47. 37 Hình ảnh 3.19 Các vùng bị lỗi Topology Tiếp sau đó cần phải kiểm tra và sửa lại những vùng được màu đỏ. Bên dưới sẽ là một số Hình ảnh phóng to của vùng lỗi sau khi gộp các mảnh bản đồ:
  48. 38 Hình ảnh 3.20. Lỗi chồng đè giữa 2 Polygon Hình ảnh 3.21. Lỗi Polygon không khép kín
  49. 39 Hình ảnh 3.22. Lỗi đường phân chia ranh giới giữa các mảnh 3.6 Chuyển đổi hệ quy chiếu từ VN2000 sang WGS84 3.6.1 Tham số chuyển đổi và lưới chiếu Sau khi thực hiện việc gộp các mảnh bản đồ lại với nhau sẽ được một bản đồ ranh giới Việt Nam được chi tiết tới cấp xã. Để có thể tích hợp vào một hệ thống và sử dụng cho các chuẩn dữ liệu toàn cầu thì việc tiếp theo cần phải chuẩn hóa hoặc chuyển đổi các độ đo quan trọng trong dữ liệu. Đối với các hệ thống GIS thì tham số đóng vai trò quan trọng đó là hệ quy chiếu. Việc chuyển đổi hệ quy chiếu sang hệ quy chiếu toàn cầu cần là một việc quan trọng trước khi thực hiện bước tiếp theo[16][17][18]. Theo quyết định 05/2007/QĐ-BTNMT[19] Về việc sử dụng hệ thống tham số tính chuyển giữa Hệ tọa độ quốc tế WGS-84 và Hệ tọa độ quốc gia VN-2000 của bộ Tài nguyên môi trường, các thông số quan trọng sử dụng trong chuyển đổi hệ tọa độ như sau: 1. Tham số dịch chuyển gốc tọa độ: -191,90441429 m -39,30318279 m -111,45032835 m 2. Góc xoay trục tọa độ: -0,00928836” -39,30318279 m -111,45032835 m 3. Hệ số tỷ lệ chiều dài: k = 1,000000252906278.
  50. 40 Khi đó trong công thức (1) X,Y,Z là tọa độ vuông góc không gian trên hệ tọa độ WGS-84 và X’,Y’,Z’ là tọa độ vuông góc không gian trên hệ tọa độ VN-2000. Bên cạnh đó cần phải xác định lưới chiếu UTM của dữ liệu đầu vào trước khi chuyển đổi. Thông tin về múi chiếu và tọa độ kinh tuyến trục được quy định tại Thông tư 973/2001/TT-TCĐC[4] của Tổng cục địa chính như sau: Bảng 3-2. Bảng Múi chiếu Múi 60 Múi 30 Số hiệu múi Kinh tuyến trục Số hiệu múi Kinh tuyến trục 481 1020 48 1050 482 1050 491 1080 49 1110 492 1110 501 1140 50 1170 502 1170 Với mỗi mảnh dữ liệu 1/50.000 có thông tin mô tả về sản phẩm như sau: Hình ảnh 3.23. Lý lịch bản đồ
  51. 41 Khi đó sẽ xác định được tập tin dữ liệu ở múi chiếu 3 và kinh tuyến trục là 105 → Số múi UTM sẽ là 48. Sau khi xác định được các tham số đầu vào bước tiếp theo là cần chuyển đổi hệ quy chiếu của dữ liệu shapefile. Ở đây tác giả lựa chọn sử dụng công cụ Geographic Transformation trên ArcMap để chuyển đổi. Để thực hiện việc chuyển đổi hệ quy chiếu bước đầu tiên là tiến hành thêm một phương pháp chuyển đổi và bước tiếp theo là thực hiện việc chuyển đổi hệ quy chiếu của dữ liệu. 3.6.2 Thêm phương pháp chuyển đổi hệ quy chiếu: Để thêm một phương pháp chuyển đổi hệ quy chiếu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Create Custom Geographic Transformation Hình ảnh 3.24. Công cụ Projections and Transformation Sau khi lựa chọn Create Custom Geographic Transformation một bảng thiết lập tham số chuyển đổi sẽ xuất hiện và lựa chọn các thông số kỹ thuật phù hợp để chuyển đổi dữ liệu.
  52. 42 Hình ảnh 3.25. Thiết lập tham số cho Projections and Transformation Một số thông số quan trọng của bảng thiết lập tham số: - Geographic Transformation Name: Đặt tên cho phương pháp chuyển đổi - Input Geographic Coordinate System: Lựa chọn hệ quy chiếu của dữ liệu đầu vào. Ở đây lựa chon VN_2000_UTM_Zone_48N theo thông số dữ liệu đầu vào đã được đề cập trên. - Output Geographic Coordinate System: Ở đây lựa chọn WGS_1984_UTM_Zone_48N. - Custom Geographic Transformation: Lựa chọn method là COORDINATE_FRAME Sử dụng các tham số chuyển đổi ở trên để thay vào bảng tham số chuyển đổi như sau:
  53. 43 Hình ảnh 3.26. Thiết lập tham số cho Projections and Transformation 3.6.3 Chuyển đổi hệ quy chiếu của dữ liệu: Để chuyển đổi hệ quy chiếu của dữ liệu trên phần mềm ArcMap như sau: Catalog → Toolboxes → System Toolboxes → Data Management Tools → Projections and Transformation → Project. Hình ảnh 3.27. Chuyển đổi hệ quy chiếu Ở cửa sổ ứng dụng lựa chọn đường dẫn input, ouput dữ liệu và phương pháp chuyển đổi đã được tạo ở trên. Kết quả dữ liệu shapefile sau khi chuyển đổi đã được đưa về đúng với hệ quy chiếu mong muốn.
  54. 44 Hình ảnh 3.28. Kết quả sau khi chuyển đổi 3.7 Xây dựng công cụ chuyển đổi dữ liệu từ shapefile sang đường Boundaries trên OSM Trong OSM các dữ liệu về đường biên giới địa giới được gọi chung là admin boundaries với tham số admin_level từ 1 → 11 để phân biệt các cấp độ hành chính. Ứng với với mỗi quốc gia hoặc vùng lãnh thổ sẽ có những mức level cho các cấp độ hành chính khác nhau. Trên OSM các lớp thông tin về admin boundaries của Việt Nam hiện nay đang được sử dụng 4 giá trị chính[20]: - admin_level = 2: đường ranh giới quốc gia - admin_level = 4: đường ranh giới tỉnh hoặc thành phố trực thuộc trung ương - admin_level = 6: đường ranh giới thuộc quận, huyện, thị xã, thành phố thuộc tỉnh. - admin_level = 8: đường ranh giới cho xã, phường, thị trấn
  55. 45 district / province commune / township border: town / ward border: quận, N/A Tỉnh, thành N/A N/A border: N/A N/A Vietnam huyện, thị xã, phố trực phường, xã, thành phố thuộc TW thị trấn thuộc tỉnh 3 4 5 6 7 8 9 10 Country admin_level Hình ảnh 3.29. Bảng Admin boundaries của Việt Nam trên OSM 3.7.1 Cấu trúc của một tập tin tin OSM Để xây dựng được công cụ chuyển đổi dữ liệu từ shapfile sang tập tin OSM thì bước đầu tiên cần kiểm tra xem cấu trúc của một OSM ra làm sao và các tham số nào được sử dụng trong OSM để xác định đó là một đường biên giới địa giới. Cấu trúc của một tập tin OSM được lưu trữ dưới dạng một tập tin XML, các nội dung trong một tập tin OSM quy định bởi các thẻ node, way và relation. - Node: là đại diện cho một điểm cụ thể được xác định bởi kinh độ và vĩ độ. Thông tin của mỗi một Node bao gồm ít nhất là id của Node và tọa độ của node. Mỗi một Node có một id và id của Node là duy nhất. - Way: là một danh sách từ 2 → 2.000 node thành lập lên một polyline. Way dùng để biểu thị các đối tượng địa lý dạng đường như biên giới, địa giới, sông ngòi, đường xá, Way có 2 loại là đóng và mở, nếu một Way có điểm đầu và điểm cuối giống nhau được gọi là Way đóng. - Relation: Mô tả mối liên kết giữa 2 hoặc nhiều đối tượng khác như (Node, Way hoặc là Relation khác).
  56. 46 Dưới đây là một cấu trúc mẫu mô tả đường bao quanh của một xã trên OSM: Hình ảnh 3.30 . Cấu trúc của một tập tin OSM Đối với Node và Way các thông tin sẽ giống với mô tả ở trên, còn đối với Relation thì một số thẻ bắt buộc để mô tả đó là đường biên giới địa giới sẽ bao gồm:
  57. 47 - admin_level: Xác định cấp hành chính, các giá trị sẽ là 4 cho hành chính cấp tỉnh/thành phố trực thuộc trung ương; 6 cho hành chính cấp huyện/thị xã/thành phố trực thuộc tỉnh; 8 cho hành chính cấp xã/phường/thị trấn - boundary: administrative - name: Tên đơn vị hành chính - type: boundary 3.7.2 Các bước tiền xử lý dữ liệu shapefile Để dễ dàng trong việc xử lý dữ liệu trước tiên sẽ cần phải thực hiện một số bước tiền xử lý dữ liệu shapefile: - Bước 1: Mở shapefile bằng phần mềm QGIS - Bước 2: Chuyển đổi các Polygon sang line - Bước 3: Sử dụng v.clean để phá vỡ các liên kết giữa các vùng - Bước 4: Lưu tập tin kết quả lại dưới dạng GeoJson Dữ liệu được lưu dưới dạng GeoJson sẽ dễ dàng trong việc xử lý hơn ở định dạng shapefile, tận dụng lợi thế đó với sự hỗ trợ của phần mềm QGIS sẽ giúp việc chuyển đổi dữ liệu từ shapefile sang GeoJson một cách dễ dàng. Với việc xây dựng đường biên giới địa giới thì dữ liệu được quan tâm sẽ là những đường viền bao quanh của một Polygon do đó trước khi được chuyển đổi sang GeoJson cần chuyển đổi Polygon sang line. Trên QGIS đã cung cấp sẵn Toolbox cho việc đó có tên là Poligon to line:
  58. 48 Hình ảnh 3.31. Polygon sang lines của QGIS Trong cấu trúc dữ liệu trên tập tin OSM, đối với các vùng biên giới địa giới sẽ không được phép lặp lại các Node hoặc Way do đó sẽ cần phải thực hiện việc loại bỏ sự trùng lặp đó trước khi chuyển đổi. Trên phần mềm QGIS cung cấp công cụ v.clean giúp phá vỡ sự liên giữa các đường biên giới địa giới đó và đồng thời giúp xóa bỏ sự trùng lặp dữ liệu: Hình ảnh 3.32. v.clean của QGIS
  59. 49 Dưới đây là Hình ảnh trước và sau khi sử dụng v.clean Hình ảnh 3.33. Trước khi sử dụng v.clean
  60. 50 Hình ảnh 3.34. Sau khi sử dụng v.clean Và bước cuối cần lưu lại dữ liệu gốc và dữ liệu sau khi đã chạy xong v.clean lưu lại dưới dạng GeoJson. Hình ảnh 3.35. Dữ liệu gốc
  61. 51 Hình ảnh 3.36. Dữ liệu sau khi chạy v.clean 3.7.3 Quy trình xây dựng chương trình xử lý Xây dựng chương trình xử lý bằng python thực hiên theo quy trình: - Đầu vào gồm 2 tập tin GeoJson bao gồm: tập tin dữ liệu thô được gọi là Raw_data và tập tin dữ liệu đã được v.clean được gọi là Preprocess_data. - Duyệt tập tin để lấy tất cả các Node từ tập tin Preprocess_data. - Lưu thông tin các Node theo cấu trúc của tập tin OSM vào tập tin kết quả - Xây dựng các Way từ tập tin Preprocess_data. - Lưu thông tin các Way theo cấu trúc của tập tin OSM vào tập tin kết quả. - Xây dựng các Relation từ các Way trước đó, xác định Way đó sẽ thuộc về xã nào, huyện nào hoặc tỉnh nào bằng cách đối chiếu với các mã đơn vị hành chính ở Raw_data. - Lưu lại thông tin Relation theo cấu trúc của tập tin OSM vào tập tin kết quả Sau khi kết thúc quá trình xử lý sẽ thu được kết quả là tập tin OSM chứa thông tin về các đường biên giới địa giới Việt Nam[21].
  62. 52 Hình ảnh 3.37. Tập tin OSM chứa thông tin về các đường biên giới địa giới Việt Nam.
  63. 53 CHƯƠNG 4: KẾT QUẢ VÀ ĐÁNH GIÁ Kết quả của chương trình biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam sẽ được mô tả ở dưới đây: Kết thúc quá trình chuyển đổi dữ liệu sang tập tin dữ liệu OSM, thu được kết quả biên giới địa giới cho 63 tỉnh thành, 708 huyện và 11.161 xã. Bảng 4-1. Dữ liệu biên giới địa giới đã được biên tập từ CSDL địa hình 1/50.000 STT Nội dung Tổng số 1 Cấp tỉnh 63 Tỉnh 58 Thành phố trực thuộc Trung ương 5 Cấp huyện 708 2 Thành phố 64 Thị xã 47 Quận 49 Huyện 548 Cấp xã 11.161 3 Xã 9.001 Phường 1.545 Thị trấn 615 Toàn bộ đường ranh giới địa giới sau khi được biên tập được mô tả trong tập tin OSM với: - 1.500.206 Node: riêng biệt, mô tả các tọa độ điểm ranh giới địa giới trên tập tin OSM. - 39.621 Way: riêng biệt, mô tả thông tin về đường ranh giới địa giới trên tập tin OSM.
  64. 54 - 11.385 Relation: riêng biệt, mô tả thông tin về các liên kết của các Way trên tập tin OSM Hình ảnh 4.1. Nội dung trong tập tin OSM Đối chiếu với một số dịch vụ bản đồ số ở trong nước như GIS Chính Phủ ( và Việt Bản đồ ( thấy rằng dữ liệu được chuyển đổi ra khớp và bao phủ toàn bộ Việt Nam
  65. 55 Hình ảnh 4.2. Bản đồ số Việt bản đồ
  66. 56 Hình ảnh 4.3. Chồng lớp nên bản đồ Việt Bản đồ
  67. 57 Hình ảnh 4.4. Bản đồ số GIS Chính Phủ
  68. 58 Hình ảnh 4.5. Chồng lớp nên bản đồ GIS Chính Phủ So sánh với dữ liệu địa giới hành chính của GIS chính phủ và Việt bản đồ thấy rằng các đường biên giới địa giới của sau khi chuyển đổi từ dữ liệu bản đồ 1/50.000 đã khớp với và bao phủ toàn Việt Nam.
  69. 59 Nhưng bên cạnh đó do nguồn dữ liệu cũ từ năm 2013 nên dữ liệu về địa giới hành chính sau khi được trích xuất ra có một số vùng dữ liệu không còn được chính xác so với thời điểm hiện tại. Bảng 4-2. Địa danh hành chính Việt Nam tính tới 01/10/2020 STT Nội dung Tổng số 1 Cấp tỉnh 63 Tỉnh 58 Thành phố trực thuộc Trung ương 5 Cấp huyện 707 2 Thành phố 77 Thị xã 49 Quận 49 Huyện 532 Cấp xã 10.614 3 Xã 8.324 Phường 1.680 Thị trấn 610 Từ bảng [4-1] và bảng [4-2] đối chiếu lại có thể thấy biến đổi từ năm 2013 đến năm 2020: - Cấp hành chính cấp tỉnh: Dữ liệu về hành chính cấp tỉnh/thành phố trực thuộc trung ương không có thay đổi; - Cấp hành chính cấp Huyện: o Thành phố: Tăng từ 64 lên 77 o Thị xã: Tăng từ 47 lên 49 o Quận: Giữ nguyên 49 o Huyện: Giảm từ 548 xuống 532 - Cấp hành chính cấp xã: o Xã: Giảm từ 9.001 xuống 8.342 o Phường: Tăng từ 1.545 lên 1.680
  70. 60 o Thị trấn: Giảm từ 615 xuống 610
  71. 61 KẾT LUẬN Kết quả đạt được: Qua quá trình tìm hiểu và nghiên cứu luận văn đã giải quyết được bài toán là: - Xây dựng quy trình và công cụ biên tập dữ liệu biên giới, địa giới cho Nền tảng cung cấp dịch vụ địa chỉ Việt Nam. - Luận văn đã thực hiện các công việc từ việc bóc tách dữ liệu biên giới địa giới trên bản đồ địa hình 1/50.000, gộp các mảnh bản đồ, chuyển đổi hệ quy chiếu cho dữ liệu cho tới việc chuyển đổi dữ liệu sang tập tin OSM. - Biên tập và chỉnh sửa dữ liệu danh giới hành chính Việt Nam tới cấp xã bao gồm: 63 tỉnh thành, 708 huyện và 11.161 xã. Hạn chế: - Quy trình và phương pháp thực hiện yêu cầu người thực hiện phải có am hiểu nhất định về GIS và xử lý dữ liệu trong GIS. - CSDL địa hình đã cũ so với thời điểm hiện tại, nên địa danh hành chính cùng biên giới địa giới chưa được cập nhật đúng với thời điểm hiện tại. - Một số vùng dữ liệu trong tập dữ liệu gốc không đầy đủ hoặc khuyết thiếu. - Khi cập nhật dữ liệu bản đồ địa hình 1/50.000 yêu cầu cần phải thực hiện lại quy trình từ đầu, tuy có thể lựa chọn vùng bị sửa đổi để cập nhật nhưng chỉ chọn vùng chỉ có thể thực hiện với bước trích xuất dữ liệu biên giới địa giới và gộp các mảnh bản đồ. Đến bước xử lý về sau bắt buộc phải xử lý toàn bộ Việt Nam.
  72. 62 TÀI LIỆU THAM KHẢO [1] Thủ tướng Chính phủ, “Quyết định số 677/QĐ-TTg của Thủ tướng Chính phủ : Về việc phê duyệt Đề án ‘Phát triển Hệ tri thức Việt số hóa.’” [2] Quốc hội, “Luật Đo đạc và Bản đồ số 27/2018/QH14 ngày 14/6/2018, hiệu lực thi hành từ ngày 01/01/2019.” . [3] Bộ Tài nguyên và Môi trường, Thông tư số 20/2014/TT-BTNMT của Bộ Tài nguyên và Môi trường : Quy định kỹ thuật về mô hình cấu trúc, nội dung cơ sở dữ liệu nền địa lý tỷ lệ 1:50.000, vol. 85, no. 1. 2014, pp. 2071–2079. [4] Tổng cục địa Chính, “Thông tư 973/2001/TT-TCĐC của Tổng cục Địa chính về việc hướng dẫn áp dụng hệ quy chiếu và hệ tọa độ quốc gia VN-2000.” . [5] “OpenStreetMap.” (accessed Sep. 03, 2020). [6] L. He, G. Wu, D. Dai, L. Chen, and G. Chen, “Data conversion between CAD and GIS in land planning,” in 2011 19th International Conference on Geoinformatics, Jun. 2011, pp. 1–4, doi: 10.1109/GeoInformatics.2011.5981193. [7] D. C. Docan, “Learning ArcGIS for Desktop : create, analyze, and map your spatial data with ArcGIS for Desktop,” Learn. ArcGIS Deskt., no. March, 2016. [8] C. WRITERS and and other Rhonda Glennon, “ArcMap Tutorial,” Far, vol. 5221112212, no. 52, pp. 227–19227, 2006, doi: 10.1007/s00779-014-0815-y. [9] QGIS Development Team, “QGIS geographic information system developers manual,” Open Source Geospatial Found. Proj., pp. 1–625, 2020, [Online]. Available: [10] UNHCR, “Mapping With Qgis for,” pp. 1–14, 2017. [11] Z. U. Ahmed, T. J. Krupnik, and M. Kamal, “Introduction to basic GIS and spatial analysis using QGIS : Applications in Bangladesh,” CIMMYT- Bangladesh, no. May, p. 146, 2018. [12] T. R. Control, “Using the JOSM Editor.” [13] JOSM Editor Basic Manual, “Java OpenStreetMap Editor Basic Manual.” [14] “Combining Spatial Data in ArcMap | GeoNet, The Esri Community | GIS and Geospatial Professional Community.” support/blog/2014/12/02/combining-spatial-data-in-arcmap (accessed Sep.
  73. 63 03, 2020). [15] “Topology in ArcGIS—Help | ArcGIS for Desktop.” in-arcgis.htm (accessed Sep. 03, 2020). [16] IHO, “User Handbook of Datum Transformations involving WGS 84,” vol. 2003, no. 60, p. 112, 2008. [17] X. Ye, X. Cao, D. Qiu, J. Cao, and Y. Wang, “Study and Realization of Coordinate Conversion in Vehicle Navigation,” in 2009 International Symposium on Intelligent Ubiquitous Computing and Education, May 2009, pp. 517–520, doi: 10.1109/IUCE.2009.81. [18] V. Janssen, “Understanding coordinate reference systems, datums and transformations,” Int. J. Geoinformatics, vol. 5, no. 4, pp. 41–53, 2009. [19] Bộ Tài nguyên và Môi trường, “Quyết định 05/2007/QĐ-BTNMT của Bộ Tài nguyên và Môi trường về sử dụng hệ thống tham số tính chuyển giữa hệ tọa độ quốc tế WGS-84 và hệ tọa độ quốc gia VN-2000.” . [20] “Tag:boundary=administrative - OpenStreetMap Wiki.” (accessed Sep. 30, 2020). [21] “JOSM.” (accessed Sep. 03, 2020).