NGÀNH CNTT TUYỂN SINH NHIỀU CHỈ TIÊU NGÀNH CNTT, CNTT VIỆT NHẬT VÀ KHOA HỌC DỮ LIỆU

Vector, Raster và bài toán dự đoán Land-use, Land-cover

on .

Vector, Raster và bài toán dự đoán Land-use, Land-cover

Phạm Quốc Cường (20521150) - Nguyễn Văn Chọn (20521138) - Lê Khánh Châu (20521125)

Hiện nay, hệ thống thông tin địa lý đang được áp dụng vào nhiều lĩnh vực đặc biệt là trong GIS (Geographic Information Systems). Có 2 loại dữ liệu thường được sử dụng xuyên suốt đối với các nhà nghiên cứu về ứng dụng GIS 3D đó là dạng dữ liệu vector và dạng dữ liệu raster.

Phương pháp vector có khả năng biểu diễn topology (tính chất không gian) rất mạnh mẽ. Các yếu tố topology như mối quan hệ đỉnh (nodes), cạnh (edges), và mặt (faces) hoặc vùng (polygons) giữa các đối tượng được bảo toàn và có thể được mô tả chính xác. Chẳng hạn như biểu diễn các mối quan hệ chứa đựng (hồ nước trong công viên), ranh giới quốc gia, các tuyến đường giao nhau,... Còn trong raster, dữ liệu được biểu diễn bằng lưới các ô vuông (pixel), và mỗi pixel chứa một giá trị tại một vị trí cụ thể. Thích hợp hơn cho việc biểu diễn dữ liệu liên tục như độ cao, màu sắc, nhiệt độ...

Trong bài nghiên cứu này chúng tôi tiến hành phân tích chi tiết về 2 loại dữ liệu trên, sau đó tiến hành thực nghiệm trong bài toán land use – land cover. Với mục tiêu chọn ra dữ liệu phù hợp để có thể dự đoán được mục đích sử dụng đất và độ che phủ đất trong các năm tiếp theo. Việc này cho phép đánh giá xu hướng phát triển đô thị, mở rộng nông nghiệp, suy thoái môi trường. Ngoài ra có thể cung cấp thêm thông tin về tình trạng sử dụng đất hiện tại trong khu vực. Hữu ích cho việc lập kế hoạch sử dụng đất và quản lý tài nguyên. Theo dõi tình hình thay đổi sử dụng đất theo thời gian.

Bước đầu thực nghiệm cho thấy dữ liệu vector cho ra kích thước file nhẹ và tốc độ tính toán nhanh hơn, biểu diễn chính xác về ranh giới hành chính, độ dốc của địa hình. Tuy nhiên lại không thể biểu diễn các chi tiết phức tạp mà phải cần đến dữ liệu raster. Chẳng hạn như biểu diễn các thông số về độ cao, các phân tích không gian hay các công trình có độ phức tạp cao. Dữ liệu raster còn thể hiện ưu thế khi có thể tận dụng các mô hình xử lý hình ảnh, thống kê, biểu diễn dữ liệu có nhiều thuộc tính. Nhưng đánh đổi bởi kích thước lớn, thời gian xử lý và khó biểu diễn được có ranh giới hành chính một cách chính xác. Sau cùng, chúng tôi áp dụng vào mô hình học máy để so sánh độ chính xác giữa hai bộ dữ liệu. Kết quả dữ liệu raster cho hiệu quả dự đoán cao hơn với độ chính xác là 90% ở mô hình KNN.

Từ những ưu và nhược điểm trên, chúng tôi đề xuất hướng nghiên cứu mới về sự kết hợp của 2 dạng dữ liệu này với kỳ vọng mô hình mới có thể sở hữu được đặc trưng ưu việt của cả 2 dạng dữ liệu. Đặc biệt là trong khuôn khổ bài toán land use – land cover đang rất được chú ý hiện nay.

Trân trọng.