Trong Xử lý ảnh, việc nhận dạng và phân loại đối tượng đòi hỏi nhiều quy trình xử lý khác nhau, trong đó một công cụ không thể thiếu đó là phát hiện cạnh. Hiện nay, các phương pháp phát hiện cạnh tiên tiến được xây dựng trên cơ sở phân tích lý thuyết chặt chẽ về các mô hình toán học của cạnh và nhiễu. Việc phát hiện cạnh không còn đơn giản như trước nữa, họ sử dụng hàng loạt kỹ thuật phức tạp như triệt tiêu không cực đại, ngưỡng trễ và ngưỡng trễ Ngưỡng cục bộ... Kết quả là phát hiện ranh giới hiệu quả và chính xác hơn.
Chương này đề cập đến ba phương pháp nâng cao để xác định ranh giới: phương pháp Canny, Shen-Castan và Marr-Hildreth.
Tổng quan về xử lý ảnh
- Xử lý ảnh
- Ảnh và điểm ảnh
- Mức xám ( Gray level)
- Pixel ( Picture element)
- Biểu diễn ảnh
- Tăng cƣờng và khôi phục ảnh
- Biến đổi ảnh
- Phân tích ảnh
- Nhận dạng ảnh
- Nén ảnh
Trong quá trình số hóa, các tín hiệu liên tục được chuyển đổi thành tín hiệu rời rạc thông qua quá trình lấy mẫu và lượng tử hóa. Mức xám là mức mã hóa tương ứng với cường độ ánh sáng của từng pixel với một giá trị số và là kết quả của quá trình lượng tử hóa. Để có thể xử lý hình ảnh bằng máy tính cần phải số hóa, chuyển đổi các tín hiệu liên tục thành tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa không gian) và định lượng các thành phần giá trị mà về nguyên tắc không thể nhìn thấy bằng mắt thường giữa hai cái liền kề không thể phân biệt được. điểm.
Là quá trình liên quan đến việc mô tả các đối tượng bạn muốn mô tả.
Các định dạng cơ bản trong xử lý ảnh
Một số khái niệm cơ bản trong phát hiện biên
- Khái niệm biên
- Tại sao phải tìm biên
- Các khái niệm về nhiễu
- Quy trình phát hiện biên
Giới hạn lý tưởng được định nghĩa là sự thay đổi giá trị mức xám tại một vị trí cụ thể. Mức độ thay đổi mức xám giữa các vùng trong ảnh càng lớn thì càng dễ nhận biết ranh giới. Ranh giới từng bước xuất hiện khi thay đổi mức xám trải rộng trên nhiều pixel.
Ranh giới thực sự xuất hiện khi mức xám thay đổi ở nhiều pixel nhưng không mịn.
Các phƣơng pháp đánh giá thuật toán phát hiện biên
Đánh giá Pratt
Trong đó: IA: số điểm cạnh được tìm thấy bằng phương pháp tìm kiếm cạnh. Ii: số điểm biên thực tế trên ảnh kiểm tra. Giá trị E là hàm của khoảng cách giữa vị trí cạnh được đo và vị trí thực tế, nhưng chỉ liên quan gián tiếp đến sai số âm và dương.
Đánh giá Kitchen-Rosenfeld
Bước đầu tiên là xác định một hàm tính toán xem điểm biên lân cận bên trái có tồn tại hay không. Thước đo tính liên tục được tính bằng trung bình của các giá trị tối đa của L(K) và R(K) và được gọi là C. Các ranh giới rộng hơn một pixel là những ranh giới có lỗi âm, có thể do thuật toán phát hiện cùng một ranh giới thực nhiều lần hơn một lần.
Độ mỏng của T là 6 pixel của vùng ảnh 3x3, tâm là pixel được xem xét và bỏ qua tâm của vùng (điểm được xem xét) và hai pixel được tìm thấy bởi L(K) và R(K) là đường viền điểm.
CÁC PHƢƠNG PHÁP PHÁT HIỆN BIÊN CỔ ĐIỂN
- Cơ sở về các phép toán tìm biên
- Khái niệm
- Toán tử đạo hàm
- Phƣơng pháp tìm biên dựa trên kĩ thuật lọc tuyến tính
- Phƣơng pháp đạo hàm bậc nhất Gradient
- Phƣơng pháp đạo hàm bậc 2 Laplace
- Một số phƣơng pháp tìm biên phi tuyến
- Phƣơng pháp tìm biên theo hình chóp ( pyramid edge
- Phƣơng pháp toán tử tìm biên la bàn Kirsch
- Kỹ thuật dò biên tổng quát
- Các khái niệm cơ bản
- Các kỹ thuật dò biên
Các phương pháp sử dụng đạo hàm bậc nhất hoạt động khá tốt khi độ sáng thay đổi rõ rệt. Khi mức xám thay đổi chậm, vùng chuyển tiếp rộng thì phương pháp này hiệu quả hơn phương pháp sử dụng đạo hàm bậc hai. Phương pháp gradient là phương pháp phát hiện cạnh cục bộ dựa trên mức tối đa của đạo hàm.
Phương pháp này có thể tạo ra một số mặt nạ khác bằng cách sử dụng kỹ thuật đạo hàm trái, phải và giữa. Các phương pháp đạo hàm bậc nhất ở trên hoạt động khá tốt khi độ sáng thay đổi rõ ràng. Phần này sẽ giới thiệu một số kỹ thuật cơ bản sử dụng phương pháp này.
PHƢƠNG PHÁP PHÁT HIỆN BIÊN DỰA VÀO
- Các phép toán hình thái cơ bản
- Thuật toán phát hiện biên dựa vào phép toán hình thái
- Ứng dụng của các phép toán hình thái trong nhận dạng biên ảnh . 32
- Phƣơng pháp Canny
- Cơ sở lý thuyết của thuật toán
- Phƣơng pháp Shen - Castan
- Cơ sở lý thuyết của thuật toán
- Hoạt động thuật toán
- Phƣơng pháp phát hiện biên Marr- Hildreth
- Cơ sở lý thuyết chung
- Mô tả thuật toán
Mặt khác, chúng ta có thể áp dụng điều này để thiết kế một hoạt động hình thái phát hiện ranh giới. Canny đã đề xuất một bộ mục tiêu cho phương pháp phát hiện cạnh và phương pháp tối ưu để đạt được các mục tiêu này. Vậy làm thế nào chúng ta có thể ước tính giá trị gradient của một điểm so với các điểm lân cận?
Giá trị của điểm chúng ta gặp theo hướng gradient không thể biết trước nhưng có thể ước tính từ gradient của các điểm lân cận. Việc đánh dấu các hàng xóm cũng có thể được thực hiện như trong quá trình xác định ngưỡng độ trễ. Tuy nhiên, không có lý do gì để cho rằng đây là phương pháp tối ưu nhất.
Điều này có nghĩa là khái niệm tối ưu chỉ là khái niệm tương đối và rất có thể có một phương pháp tối ưu hơn. Tiếp theo, chúng ta sẽ xem xét một thuật toán cũng hoạt động tốt trong nhiều trường hợp hình ảnh khác nhau, đó là phương pháp phát hiện cạnh Shen-Castan. Sau khi đọc ảnh, chúng ta lọc ảnh ở bước 2 của thuật toán bằng hàm ISEF đệ quy.
Các điểm biên có thể được đặt ngưỡng bằng cách áp dụng hàm ngưỡng tổng thể cho độ dốc, nhưng Shen và Castan đã đề xuất một phương pháp gọi là phương pháp độ dốc thích ứng. Các điểm có thể là ranh giới là các điểm có giá trị 1 trong Ma trận giao nhau bằng 0 ỨNG DỤNG CÁC PHƯƠNG PHÁP PHÁT HIỆN CẠNH. Sau khi bắt đầu tìm hiểu về các phương pháp và thuật toán phát hiện cạnh, tôi đã nghĩ ra cách ứng dụng các thuật toán trên.
Thuật toán phát hiện xương dựa trên phân mảnh là một trong những thuật toán quan trọng trong xử lý ảnh.
CÀI ĐẶT VÀ ĐÁNH GIÁ CÁC THUẬT TOÁN
Các phƣơng pháp cổ điển
- Thuật toán
Sau khi sử dụng phương pháp gradient (a) trên ảnh, chúng ta có thể thấy các cạnh được tách ra mỏng, nhiễu trong ảnh đã được xử lý tốt, những nơi có nhiều nhiễu không được coi là biên. Tuy nhiên, thuật toán không thể xác định được các cạnh có mức độ thay đổi thang độ xám không lớn. Kết quả là ranh giới bị gián đoạn nghiêm trọng, dẫn đến mất thông tin hình ảnh.
Nguyên nhân không nhận ra cạnh nào là do phương pháp vi phân tại các cạnh mà mức xám thay đổi ít, kết quả chênh lệch nhỏ khiến quá trình phân ngưỡng không thể nhận ra các cạnh này. Phương pháp Sobel khắc phục tình trạng mất cạnh đồng thời xử lý nhiễu tốt.
Phƣơng pháp Canny và phƣơng pháp Shen-Castan
- So sánh hai thuật toán
- Đánh giá và so sánh hai phƣơng pháp
Khi thực hiện phép nhân tích chập, thuật toán Canny sử dụng phương pháp tích chập nên các điểm đen xuất hiện ở các vùng gần ranh giới (đôi khi những điểm này được coi là nhiễu. Trong khi đó, thuật toán ISEF sử dụng bộ lọc thứ cấp). Quy tắc này thực hiện phép nhân tích chập bằng phương pháp tích chập. quá cứng, dẫn đến các cạnh của những hình ảnh này có màu trắng trong đó mặt nạ chập vượt quá hình ảnh.
Từ đánh giá trên, chúng tôi có kết luận như sau: trong trường hợp có nhiều nhiễu loạn, phương pháp ISEF dường như đạt kết quả cao hơn phương pháp Canny. Trong trường hợp có nhiễu loạn nhỏ, hiệu suất của hai phương pháp này là như nhau. Nếu đánh giá tổng thể thì phương pháp ISEF được xếp hạng đầu tiên vì độ mỏng của ranh giới có vẻ tốt hơn.
Hai phương pháp cho kết quả khá gần nhau. Khi áp dụng vào hình ảnh, sự khác biệt về kết quả giữa hai thuật toán độ trễ là không đáng kể nhưng bằng trực giác thì không thể nhận ra được những lỗi này. Có thể nói, kết quả thu được của hai phương pháp này vượt trội hơn so với các phương pháp khác. Những thiếu sót trong phương pháp, chẳng hạn như không nhận được các cạnh hoàn chỉnh, nhận ra nhiều cạnh khi chỉ tồn tại một cạnh.
Mặc dù cho kết quả cao nhưng hai phương pháp trên vẫn còn những hạn chế nhưng không đáng kể. Do thời gian và trình độ có hạn nên xử lý ảnh là một chủ đề mới trong nghiên cứu khoa học và lần đầu tôi tiếp xúc với ngôn ngữ lập trình Virtual C++ chưa lâu nên vẫn còn nhiều phương pháp. Việc phát hiện biên chưa được nghiên cứu nên chương trình còn nhiều bất cập. Đây là một phương pháp rất phổ biến được sử dụng trong các bài toán tìm ranh giới. Phương pháp này dựa trên các mẫu xếp chồng, còn được gọi là mẫu xếp chồng Sobel.
Ma trận này là kết quả của phép tính đạo hàm (Gradient) ở trên trong chương trình này sử dụng ma trận có kích thước 3 3.