Bài giảng Xử lý ảnh - PGS.TS. Đỗ Năng Toàn

Lượt xem: 81,241Lượt tải: 9Số trang: 113

Mô tả tài liệu

Bài giảng "Xử lý ảnh" này được biên soạn với nội dung trình bày gồm 7 chương, bài giảng có thể được dùng làm tài liệu tham khảo cho sinh viên các hệ kỹ sư, cử nhân và các bạn quan tâm đến vấn đề nhận dạng và xử lý ảnh.

Tóm tắt nội dung

Khoảng hơn mười năm trở lại đây, phần cứng máy tính và các thiết bị liên quan đã có giảm đến mức máy tính và các thiết bị liên quan đến xử lý ảnh đã không còn là thiết bị hội và việc thu nhận ảnh số bằng các thiết bị cá nhân hay chuyên dụng cùng với việc đưa Trong hoàn cảnh đó, xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành tập trung vào các vấn đề cơ bản của xử lý ảnh nhằm cung cấp một nền tảng kiến thức đầy đủ và chọn lọc nhằm giúp người đọc có thể tự tìm hiểu và xây dựng các chương trình ứng Giáo trình được chia làm 7 chương: Chương 1, trình bày Tổng quan về xử lý ảnh, các khái niệm cơ bản, sơ đồ tổng quát của một hệ thống xử lý ảnh và các vấn đề cơ bản trong thu nhận ảnh cơ bản, quá trình lấy mẫu và lượng tử hóa, một số phương pháp biểu diễn ảnh, cũng như một số định dạng ảnh phổ lượng ảnh dựa vào các thao tác với điểm ảnh, nâng cao chất lượng ảnh thông qua việc xử lý các điểm ảnh trong lân cận điểm ảnh đang xét. bản trong việc phát hiện biên của các đối tượng ảnh theo cả hai khuynh hướng: Phát hiện Chương 5 thể hiện các kỹ thuật phân vùng ảnh, đây là khâu quan trọng hỗ trợ cho việc trích chọn các thuộc tính của ảnh để tiến tới hiểu Chương 6, trình bày các vấn đề và kỹ thuật liên quan đến nhận dạng ảnh, theo tiếp cận Và cuối cùng là Chương 7 với các kỹ thuật nén ảnh, đây là vấn đề luôn được quan tâm trong xử lý ảnh. sinh viên các hệ kỹ sư, cử nhân và các bạn quan tâm đến vấn đề nhận dạng và xử lý ảnh. Nhận dạng và phân loại ĐỊNH DẠNG ẢNH CƠ BẢN THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ ĐIỂM THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ KHÔNG GIAN QUÁT VỀ BIÊN VÀ PHÂN LOẠI CÁC KỸ THUẬT DÒ BIÊN CƠ BẢN ..... Chu tuyến của một đối tượng VÙNG ẢNH THEO NGƯỠNG BIÊN ĐỘ năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2,..., cn). Do đó, ảnh trong xử lý ảnh có Các bước cơ bản trong một hệ thống xử lý ảnh Hình 1.2 biểu diễn sơ đồ tổng quát của một hệ thống xử lý ảnh:  Khối trich chọn đặc điểm: có nhiệm vụ trích chọn các đặc trưng quan trọng của các bức ảnh đã được tiền xử lý để sử dụng trong hệ quyết định  Khối hậu xử lý: có nhiệm vụ xử lý các đặc điểm đã trích chọn, có thể lược bỏ hoặc biến đổi các đặc điểm này để phù hợp với các kỹ thuật cụ thể sử dụng trong Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một vị trí nào đó của đối tượng trong không gian và ảnh được xem như là một tập hợp các điểm ảnh. Là số các giá trị có thể có của các điểm ảnh của ảnh Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử. Để khắc phục người ta sử dụng các phép chiếu được xây dựng trên tập các điểm điều Giả sử có hai ảnh I và I' tương ứng với ảnh thu nhận được và ảnh mong muốn. một điểm thuộc I tương ứng với một điểm Pi' trên I', ta có n các cặp điểm điều khiển như Thông thường các điểm điều khiển được lấy bằng cách chụp những ảnh có cấu trúc định sẵn như là ảnh lưới giống như ảnh mong muốn trên Hình 1.3. Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh mà chúng ta cần loại bỏ:  Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi Chỉnh số mức xám là nhằm khắc phục tính không đồng đều của hệ thống xử lý ảnh,  Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một Trường hợp giảm xuống 2 mức xám thì chính là chuyển về ảnh đen số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. ảnh việc trích chọn đặc điểm là một bước quan đặc điểm của đối tượng được điểm của ảnh sau đây:  Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện  Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do Các đặc điểm này có thể được Để thu được ảnh biên ta có thể sử dụng toán tử Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng ảnh Nhận dạng và phân loại ảnh nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể sử dụng analyis), trong đó mẫu đầu vào được định danh thành một phần của được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Trong ứng dụng thực tiễn, không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại “tối ưu” vì vậy các phương thức phân loại tổ hợp thường được sử dụng khi nhận dạng. Cho đến nay các hệ thống lai (hybrid system) sử dụng nhiều phương pháp và cách tiếp cận Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu là nén có bảo toàn và không bảo toàn thông tin. khả năng nén cao hơn nhưng không phục hồi được ảnh gốc, ngược lại nén có bảo toàn cho của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.  Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các  Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không  Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng của ảnh thể hiện sự lặp lại của các chi tiết tại nhiều vị trí khác nhau với Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông dụng Raster, Vector và có thể cho ảnh đen trắng hoặc ảnh màu. Các thiết bị thu nhận ảnh Raster thông thường là camera, nhận ảnh Vector thông thường là sensor hoặc bàn số hoá hoặc được chuyển Các hệ thống thu nhận ảnh sử dụng chung một quá trình thu nhận: Người ta sử dụng bộ cảm biến hoặc máy quét để biến tín hiệu quang của ảnh thành chiều ngang để tạo ra tín hiệu điện của ảnh, kết quả cho ra một tín hiệu điện hai chiều Xét ảnh liên tục được biểu diễn bởi hàm I(x, y), gọi x là khoảng cách giữa hai điểm được giữ lại theo trục x, gọi y là khoảng cách giữa hai điểm được giữ lại theo trục y. x được gọi là chu kỳ lấy mẫu theo trục x và y. Gọi fxmax, fymax là tần số cao nhất của tín hiệu theo trục x, y thì: Ảnh sau khi lấy mẫu sẽ có dạng I(m,n) với m, n là nguyên nhưng giá trị I(m, n) vẫn  Với ảnh đa cấp xám thì L=256, f(m,n) = g  255,0  Với ảnh 24 bit thì L=224, f(m, n) = g  12,0 24  Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý. Ảnh được biểu diễn theo hai mô hình cơ bản, ảnh Raster và ảnh là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễn dưới dạng theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn qua 1 hay nhiều bít. ảnh trên một đơn vị kích thước vật lý được gọi là độ phân giải. Ảnh có độ phân giải cao thì thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể. cấp những thiết bị thu nhận ảnh Raster phù hợp với tốc độ nhanh và chất lượng cao cho cả Một trong những hướng nghiên cứu cơ bản trên mô hình biểu diễn này là kỹ thuật khuôn dạng ảnh thông dụng (BMP, TIF, GIF, PCX v.v..) bao gồm cả trong đó các kỹ thuật Trong mô hình vector người ta sử dụng hướng giữa các vector của điểm ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vector được thu nhận trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster thông qua các chương trình số hoá Sự chuyển đổi giữa các mô hình biểu diễn ảnh CÁC ĐỊNH DẠNG ẢNH CƠ BẢN Ảnh IMG là ảnh đen trắng, phần đầu của ảnh IMG có 16 byte chứa các thông tin: Đó là độ dài của dãy các byte kề liền nhau  2 byte tiếp: số pixel trên một dòng ảnh. Ảnh IMG được nén theo từng dòng, mỗi dòng bao gồm các gói thứ hai cho biết số các dãy giống nhau được nén trong gói.  Loại 3: Dãy các Pixel không giống nhau, không lặp lại và không nén được. Tuỳ theo các bít cao của byte đầu tiên được Nếu bít cao được bật (giá trị 1) thì đây là gói nén các byte chỉ gồm bít Các gói tin của file IMG rất đa dạng do ảnh IMG là ảnh đen trắng, do vậy chỉ cần 1 Toàn bộ ảnh chỉ có những điểm sáng và Định dạng ảnh PCX là một trong những định dạng ảnh cổ của tệp PCX có kích thước cố định gồm 128 byte và được phân bố như sau:  1 byte: chỉ ra kiểu định dạng.Nếu là PCX/PCC thì nó luôn có giá trị là 0Ah.  1 byte: chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:  1 byte: Số bít cho một điểm ảnh phẳng kiểu PCX nó có giá trị là (0,0), cũn PCC thì  1 word: kích thước bề rộng và bề cao của ảnh. Với ảnh 16 màu, giá trị này là 4, với ảnh Định dạng ảnh PCX thường được dùng để lưu trữ ảnh và thao tác đơn giản, cho phép  Phần Header (IFH): có trong tất cả các tệp TIFF và gồm 8 byte: Nếu trường này có giá trị là 4D4Dh thì đó là ảnh cho máy nếu là  Phần thứ 3: các DE: các DE có dộ dài cố định gồm 12 byte và chia làm 4 phần: các thông tin về ảnh, một bảng màu và một mảng dữ liệu đó, các cấu trúc được định nghĩa như sau: biWidth Chiều rộng của ảnh, tính bằng số điểm ảnh biHeight Chiều cao của ảnh, tính bằng số điểm ảnh Số bit cho một điểm ảnh độ phân giải ngang của thiết bị, tính bằng điểm ảnh trên met độ phân giải dọc của thiết bị, tính bằng điểm ảnh trên met Số lượng các màu thực sự được sử dụng Sau bước chụp là kỹ thuật phòng tối nhằm tăng cường ảnh như mong muốn. Các màu chói, cường độ cao trên ảnh sẽ giảm đi. Người ta dùng kỹ thuật nửa cường độ để thể hiện ảnh trên sách báo, tạp này, một ảnh tạo nên bởi một chuỗi các điểm in trên giấy. có thể được coi là một hình vuông trắng bao quanh một chấm đen. Vùng trắng là vùng gồm một chùm các điểm ảnh có rất ít hoặc không có chấm đen. Từ đặc điểm cảm nhận của mắt người, sự thay đổi cường độ chấm đen trong các phần tử ảnh trắng tạo nên mô phỏng của một ảnh liên tục. nửa cường độ với độ phân giải từ 60 đến 80 DPI(dot per inchs: số điểm ảnh trên một inch), đen có kích thước khác nhau của ảnh, vì vậy chúng ta cần các kỹ thuật nửa cường độ kỹ Các điểm trong ảnh được Giá trị của ngưỡng sẽ quyết định điểm có được hiển thị này là chọn ngưỡng dựa trên lược đồ mức xám của ảnh. Như vậy nghĩa là các điểm có giá trị điểm ảnh lớn hơn 127 sẽ là 1, ngược lại Kỹ thuật này sử dụng một nhóm các phần tử trên thiết bị ra (máy in chẳng hạn) để Các phần tử này mô phỏng các chấm đen trong kỹ thuật nửa cường độ. Việc chọn kích thước của nhóm như vậy sẽ làm giảm độ mịn của này chỉ áp dụng trong trường hợp mà độ phân giải của thiết bị ra lớn hơn độ phân giải là việc biến đổi một ảnh đa cấp xám (nhiều mức sáng tối) sang ảnh nhị Kỹ thuật Dithering đựợc áp dụng để tạo ra ảnh đa cấp sáng khi độ Kỹ thuật này sử dụng một ma trận mẫu gọi là ma trận Để tạo ảnh, mỗi phần tử của ảnh gốc sẽ được so sánh với phần tử tương ứng của ma Khuếch tán lỗi cho phép giảm thiểu mức độ mất chi tiết của ảnh khi tách ngưỡng bằng cách phân tán lỗi do lượng tử hóa ra các điểm ảnh xung trị điểm ảnh của một vùng nhỏ được giữ tương đối gần với giá trị trên ảnh tán lỗi một chiều chỉ phân tán lỗi sang điểm ảnh lân cận trên cùng một dòng trong khi đó khuếch tán lỗi hai chiều phân tán lỗi sang các điểm ảnh lân cận theo một tỷ lệ xác o Tại mỗi điểm ảnh, giá trị điểm ảnh được tách theo ngưỡng có sẵn. o Phần dư do lượng tử hóa được được chuyến sang điểm ảnh tiếp theo trên o Các bước được lặp lại cho đến hết dòng, phần dư của điểm ảnh cuối cùng sẽ "#" chỉ điểm đang xét và "" chỉ các điểm đã xét, các con số chỉ tỷ lệ lỗi được phân Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị cường độ sáng. thể xử lý ảnh bằng máy tính người ta cần thiết phải số hóa ảnh. Một ảnh sẽ là một tập hợp các phần tử ảnh (Picture Như vậy, ảnh số là một tập hợp các điểm ảnh. diễn bởi một mảng hai chiều I(n,p) với n là số dòng và p là số ta thường ký hiệu I(x,y) để chỉ một pixel I chính là giá trị cường độ sáng của Ảnh có thể được biểu diễn với các độ phân giải khác nhau. thể được lưu trữ trên 1, 4, 8 hay 24 bit tùy thuộc vào các mức cường độ sáng cần phân biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đó. Người ta thường chia ảnh số ra làm ba loại chính là:  Ảnh đen trắng: Mỗi phần tử ảnh nhận một trong hai giá trị tương ứng với hai mức sáng đen và trắng (còn gọi là ảnh nhị phân)  Ảnh đa mức xám Các phần tử ảnh chứa thông số về cường độ sáng hoặc hơn nữa, ảnh xám có một đặc trưng là lược đồ xám Ảnh mầu: Mỗi phần tử ảnh được lưu trữ trong ảnh dưới dạng một cấu trúc có 3 ảnh sẽ là tổng hợp của 3 giá trị trên. Như vậy ảnh màu là ảnh mang thông tin về đối tượng đầy đủ nhất so với ảnh đen Thực tế thì một màu được phân biệt qua 3 thuộc tính là độ chói nhận của mắt người thì cách biểu diễn ảnh dưới dạng cấu trúc 3 màu RGB chất lượng ảnh thu được là có thể chấp nhận được. Màu sắc được tạo ra bởi các ánh sáng với các bước sóng khác nhau, mắt người bao Một màu có thể được biểu diễn bởi ba Trong xử lý ảnh và đồ họa, mô hình màu là một chỉ số kỹ thuật của một hệ tọa độ Green, Blue): là một đơn vị tập các màu thành phần sắp xếp theo hình lập phương của hệ Mục đích của mô hình màu là cho phép biểu diễn một phần các mầu nhìn thấy được Sau đây, ta xem xét một số mô hình hay được sử dụng Các mầu gốc này được tổ hợp với nhau theo một tỷ lệ để tái tạo mầu sắc, hệ Đường chéo chính của khối lập phương thể hiện các mầu được phối bởi ba mầu gốc với tỷ lệ tương đương nhau ứng với các mức độ xám từ đen là (0,0,0) t trắng nhạt (Cyan), vàng (Yellow) và tím (Magenta) là các phần bù tương ứng cho Chúng có thể được sử dụng để lọc loại trừ các màu này từ ánh Vì vậy CMY còn được gọi là các phần bù loại trừ của màu gốc. hệ mầu CMY cũng được biểu diễn trong hệ tọa độ Đề-các nhưng phương pháp phối màu Các mô hình màu RGB, CMY có thể hiển thị được tất cả các mầu cần thiết, tuy vậy Smith định nghĩa mô hình màu HSV của hay HSB với B là (độ sáng) hướng được hiểu là độ sáng của m ệ thống tọa độ có dạng hình trụ và tập màu thành phần của không gian b ức độ tươi của mầu, các mầu xám từ đen tới trắng có S ộ sáng của màu, V là 0 thì là màu đen, V là 1 thì là mầu có độ sáng tối đa. ủa mầu, các mầu xám từ đen tới trắng có S là 0. chiều với ảnh sau, được biết ngưỡng là 127. tán lỗi hai chiều với ảnh ở câu 3 sử dụng ma trận khuếch tán lỗi Floyd và được trình bày ở trên, hãy viết một phần mềm nhỏ có thể chuyển ảnh giữa các hệ mầu RGB, CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ ĐIỂM của điểm ảnh. Một trong những khái niệm quan trọng trong xử lý ảnh là biểu đồ tần suất Biểu đồ tần suất của mức xám g của ảnh I là số điểm ảnh có giá trị g của ảnh Giả sử ta có ảnh I ~ kích thước m  n và số nguyên c Giả sử ta có ảnh I ~ kích thước m  n, hai số Min, Max và ngưỡng  Nếu Min = 0, Max = 1 thì ảnh thu được sau tách ngưỡng là ảnh đen I được gọi là cân bằng "lý tưởng" nếu với mọi mức xám g, g’ ta có h(g) = h(g’) ~ số mức xám mới của ảnh sau cân bằng, thông thường giá trị này có thể bằng đúng số mức xám của ảnh gốc  ~ số điểm ảnh trung bình của mỗi mức xám của ảnh đã cân bằng )()( ~ số điểm ảnh có mức xám  g trên ảnh gốc chúng ta có thể thấy biểu đồ tần suất của anh sau cân bằng đồng đều hơn rất nhiều so ảnh theo một nguyên lý trong vật lý là vật thể có thể tách làm 2 phần nếu tổng độ lệnh trong Giả sử, ta có ảnh G ~ là số mức xám của ảnh kể cả khuyết thiếu t(g) ~ số điểm ảnh có mức xám  g Nếu biết ảnh và hàm biến đổi thì ta có thể tính được ảnh kết quả và do đó ta sẽ có được histogram của ảnh biến đổi. gốc và hàm biến đổi, câu hỏi đặt ra là liệu ta có thể có được histogram của ảnh biến đổi. Nếu có như vậy ta có thể hiệu chỉnh hàm biến đổi để thu được ảnh kết quả có phân bố Bài toán đặt ra là biết histogram của ảnh, biết hàm biến đổi hãy vẽ histogram của Giả sử ta có ảnh gốc I với các mức xám g và biểu đồ tần suất biến ảnh I thành I' với các mức xám q như vậy )(gfq  . CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ KHÔNG GIAN Hầu hết các phương pháp xử lý ảnh sử dụng toán tử không gian là phương pháp cửa dựa vào giá trị điểm ảnh nằm trong một cửa sổ bao trùm các điểm ảnh lân cận. Gọi I và J là ảnh sao cho J = T[J]. Đây là phép biến đổi cửa sổ di chuyển với kích thước (s+1) x (d+1) và giá trị được Nhân chập là một phép cửa sổ di chuyển, phép biến đổi được định nghĩa thông qua Giả sử ta có ảnh I kích thước M  N, mẫu T có kích thước m  n khi đó, ảnh I nhân chập theo mẫu T được xác định bởi công quá trình thực hiện phép nhân chập có một số thao tác ra ngoài ảnh, ảnh không được xác định tại những vị trí đó dẫn đến ảnh thu được có kích thước nhỏ hơn. Ảnh thực hiện theo công thức 3.1 và 3.2 chỉ sai khác nhau 1 phép dịch chuyển để Dùng để khử nhiễu  Các điểm có tần số cao Dùng để phát hiện các điểm có tần số cao Giả sử ta có ảnh I ngưỡng  cửa sổ W(P) và điểm ảnh P Khi đó kỹ thuật lọc trung vị phụ thuộc không gian bao gồm các bước cơ bản sau: Giá trị 16, sau phép lọc có giá trị 2, các giá trị còn lại không thay đổi. Cho dãy x1, x2…, xn khi đó trung bình của dãy ký hiệu AV(xn) được định nghĩa: Giả sử ta có ảnh I, điểm ảnh P, cửa sổ W(P) và ngưỡng . Giả sử ta có ảnh I, điểm ảnh P, cửa sổ W(P), ngưỡng  và số k. là 1 thì ảnh kết quả không thay đổi. Ảnh được coi là một miền đồng nhất về mức xám, tức là các điểm ảnh lân cận có sự các điểm ảnh đều có giá trị gần bằng như tế quan sát có những điểm ảnh có giá trị khác hơn nhiều so với các điểm ảnh xung ảnh số được xem như là sự dịch chuyển đột ngột của tín hiệu ảnh trên một khoảng Hệ thống thu nhận ảnh chuyển các hình ảnh thực của môi trường xung quanh g(x,y) Do đó tín hiệu g’(x,y) có thể chứa các thành phần nhiễu trong đó. Quá trình thu nhận ảnh có nhiễu có thể mô tả một cách trực quan như sau: Khi đó g(x,y) sẽ chuyển thành ảnh rời rạc g[m,n], ảnh liên tục g’(x,y) sẽ chuyển thành ma trận điểm ảnh g’[m,n] và nhiễu cũng phân bố rời rạc tại các Đối với xử lý số ảnh thì ta chỉ sử dụng mô hình nhiễu rời rạc.  Nhiễu do thiết bị thu nhận ảnh: là loại nhiễu gây ra do giới hạn nhiễu xạ và  Nhiễu nhẫu nhiên độc lập: là các loại nhiễu gây ra do ảnh hưởng của môi trường  Nhiễu do vật quan sát: là nhiễu gây ra do bề mặt của bản thân vật có độ nhám gồ Chính nhiễu này gây hiện tượng tán xạ của các tia đơn sắc và sinh ra hiện Thường người ta xấp xỉ các loại nhiễu bằng các quá trình tuyến tính bất biến vì có nhiều công cụ tuyến tính có thể giải quyết vấn đề khôi phục ảnh hơn là các công cụ phi Trong phần này ta sẽ xét hai kỹ thuật lọc tuyến tính hay sử dụng là lọc đảo và lọc Nguyên lý của lọc đảo là sử dụng hàm ngược của đáp ứng xung h[m,n] để khôi phục lại một ảnh xấp xỉ ảnh nguyên gốc g[m,n] từ ảnh g’[m,n] đã biết nguyên lý này được biễu Như vậy ảnh khôi phục g*[m,n] sẽ được tính theo công thức: Trong đó h-1[m,n] chính là hàm của bộ lọc đảo. Như vậy ta đã khôi phục được ảnh g[m,n] Nếu đánh giá được mức nhiễu ta có thể xấp xỉ gần hơn với ảnh nguyên Kỹ thuật lọc này khắc phục được nhược điểm của kỹ thuật lọc đảo là làm cho hàm Trong trường hợp ảnh nguyên gốc g[m,n] chuyển động tịnh tiến theo phương x và y sinh ra hiện tượng nhoè ảnh thì HT[u,v] sẽ được xác định theo các thông số chuyển động, và lọc giả đảo có khả năng khôi phục được ảnh nhoè này. Phần này ta sẽ nghiên cứu một kỹ thuật lọc nhiễu lốm đốm là Kỹ thuật lọc nhiễu trung bình thống kê tiến hành thống kê các cường độ sáng của đối tượng ảnh bị nhiễu lốm đốm bằng N lần thu nhận độc lập và lấy trung bình các cường Ta giả thiết hệ thống chỉ có nhiễu lốm đốm và nhiễu này có thể coi như là tổng vô số Với aR và aL là các biến ngẫu nhiên độc lập phân bố theo Gaussian, ứng với mỗi toạ độ [m,n] có trung bình bằng 0 và phương sai 2. Như vậy ảnh thu được trong lần nhận thứ i (1,...,N) sẽ là: Trị trung bình thống kê của N lần thu nhận ảnh sẽ là: Trong đó sN[m,n] là trị trung bình thống kê của trường cường độ nhiễu lốm đốm Từ công thức 3.12 ta thấy có thể tìm ra z[m,n] từ wN[m,n] và điểm ảnh có giá trị từ 0 đến 9: � = Câu 2: Thực hiện các phép biến đổi sau với ảnh I ở câu 1.  Cân bằng tần suất với ảnh kết quả có cùng số mức xám với ảnh gốc. Lưu ý: Các điểm ảnh chỉ nhận giá trị từ 0 đến 9. ảnh I' sau khi được biến đổi từ ảnh I sử dụng biểu thức: � = � Câu 5: Thực hiện lọc với cửa sổ 3x3 và θ = 3 sử dụng các phương pháp sau với ảnh I KHÁI QUÁT VỀ BIÊN VÀ PHÂN LOẠI CÁC KỸ THUẬT DÒ BIÊN CƠ BẢN Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu ảnh. nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo về sự thay đổi đột ngột về cấp xám. dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất Tập hợp các điểm biên tạo nên biên hay đường bao của đối Nếu lấy đạo hàm bậc nhất của ảnh ta có các kỹ thuật Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật ra còn có một số các tiếp  Phát hiện biên gián tiếp: Nếu bằng cách nào đó ta phân được ảnh thành các vùng Kỹ thuật dò biên và phân vùng ảnh là hai lớp xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã được phân lớp thành các đối tượng, do đó có thể phát hiện được pháp phát hiện biên trực tiếp tỏ ra khá hiệu quả và ít chịu ảnh hưởng của trực tiếp cho ta kết quả là ảnh biên, còn phương pháp phát hiện biên gián tiếp cho ta kết Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh, ta có: Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y. các kỹ thuật nhân chập vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại. Giả sử với dx và dy nhỏ nhất là 1, ta có: Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hướng x và y là: Các bước tính toán của kỹ thuật Prewitt + Bước 3: Phân ngưỡng theo θ để có ảnh biên + Bước 3: Phân ngưỡng theo θ để có ảnh biên + Bước 3: Phân ngưỡng theo θ để có ảnh biên Đây là một thuật toán được phát triển khá sớm nhưng cho đến nay vẫn là một trong những kỹ thuật được sử dụng rộng rãi, cho các kết quả tương đối tốt, có khả năng đưa ra Tính gradient của ảnh bằng mặt nạ PreWitt (hoặc các m � I1, I2 là hai điểm lân cận của (i,j) theo hướng . lọc các điểm được giữ lại sử dụng ngưỡng cao, chỉ những điểm có độ lớn gradient cao hơn xác định điểm dừng của biên (nếu giá trị điểm tiếp theo thấp hơn ngưỡng này, việc dò theo Các kỹ thuật thông thường để có được ảnh biên thường sử dụng một ngưỡng, điểm ảnh có độ lớn gradien lớn hơn ngưỡng này sẽ được chọn làm biên. sử dụng một ngưỡng không thể vừa chọn biên chính xác và mảnh như Canny, và thông vào trung bình cục bộ trên cơ sở đánh giá độ chênh lệch về giá trị mức xám của điểm ảnh so với các điểm lân cận do đó kết hợp được ưu điểm của cả hai khuynh hướng trực tiếp và Đối với các ảnh màu theo mô hình nào đó đều có thể chuyển sang mô hình gồm 3 Sau đó dễ dàng chuyển các ảnh màu sang dạng ảnh đa cấp xám. Giá trị xám của điểm ảnh có thể được tính là trung bình cộng của ba thành phân màu R,G Việc xử lý, thao tác trên các ảnh xám có một ưu điểm là dễ xử lý hơn các ảnh màu mà vẫn giữ được các đặc tính của ảnh. Một cách lý tưởng đồ thị biến thiên mức xám của điểm ảnh khi qua biên phải Trong thực tế dạng đồ thị này chỉ gặp trong các ảnh trắng đen (ảnh xám có hai màu), còn với các ảnh thực thì đồ thị của nó có dạng: Khó khăn cho việc phân tích các ảnh trên thực tế là ở chỗ sự biến thiên về mức xám của điểm ảnh không phải chỉ được thể hiện theo một hướng duy nhất mà phải xét theo cả tám hướng của các điểm ảnh láng giềng, tại các vùng biên và lân cận biên sự biến thiên mức xám của các điểm ảnh thường không đột ngột mà trải qua một khoảng biến thiên Chúng ta có thể xác định được các đường biên như thế này bằng kỹ thuật Laplace nhưng như ở trên đã nói kỹ thuật này rất nhạy cảm với nhiễu mà nhiễu hầu như lại là vấn Ngoài ra, trong thực tế khi dò biên cho các ảnh xám tùy theo mục đích xử lý sau này mà người ta có thể muốn lấy biên của tất cả các đối tượng trong ảnh hoặc chỉ một số đối tượng chính trong ảnh. mặt nạ là các ma trận nhân chập nên khó điều chỉnh độ chi tiết của ảnh biên thu làm được điều này lại phải tính toán lại các giá trị của các phần tử trong ma sau khi lọc không làm mất đi được tất cả các điểm không thuộc đường biên mà chỉ làm nổi lên các điểm nằm trên biên và muốn nhận dạng được các đối tượng thì ta còn phải xử lý thêm một vài bước nữa thì mới thu được ảnh biên thực sự. Có thể nhận thấy là các thuật Ý tưởng chính của thuật toán được đề xuất là: Xác định tất cả các điểm nằm trên biên không theo hướng tìm kiếm và sử dụng các ma trận lọc, thông qua việc so sánh độ chênh lệch về mức xám của nó so với mức xám chung của các điểm ảnh lân cận (mức xám hết giá trị xám trung bình của các điểm ảnh nằm trong phạm vi của ma trận 3×3 hoặc 5×5 có tâm là điểm ảnh đang xét sẽ được tính toán. đó (PTB+ δ1< P) thì chúng ta sẽ coi nó là điểm biên và ghi nhận lại, còn các điểm không Ma trận điểm ảnh trước và sau lọc Thuật toán có thể được mô tả như sau:  biWidth, biHeight: là chiều rộng và chiều cao của ảnh tính theo đơn vị Pixel.  pOrgImg, pBdImg: lần lượt là các con trỏ trỏ đến các vùng dữ liệu của ảnh gốc và  là tổng giá trị độ xám của các điểm ảnh thuộc ma trận 3×3 có tâm là  δ1: là độ chênh lệch mức xám của điểm ảnh đang xét so với giá trị xám trung bình  và là các hàm đọc, ghi giá trị điểm ta có thể so sánh được hiệu quả của thuật toán phát hiện biên này so với các ảnh gốc, Hình 4.3b là ảnh biên qua lọc Sobel Hx, Hình 4.3c là ảnh biên qua lọc Sobel Hy, ảnh biên thu được khi sử dụng thuật toán phát hiện biên đề xuất dựa vào trung bình cục bộ Hình 4.3a là ảnh biên thu được với δ1= 25, Hình 4.3b là ảnh biên Các ảnh biên theo các thuật toán phát hiện biên truyền thống a) Ảnh biên thu được với δ1= 25 b) Ảnh biên thu được với δ1= 250 Các ảnh biên kết quả thu được theo thuật toán đề xuất Chúng ta có nhận xét là ảnh gốc sử dụng trong chương trình có mầu nền khá tối và dụng các bộ lọc và làm nổi rõ các đường biên nhưng vẫn không loại bỏ được hầu hết các Thuật toán có độ phức tạp tỷ lệ với kích thước ảnh và kích thước cửa sổ. của thuật toán là O(n2) nên nó thực hiện việc tìm biên khá nhanh, ảnh biên thu được chỉ gồm các điểm ảnh và điểm biên nên dễ xử lý, bản thân thuật toán này cũng ít chịu ảnh hưởng của nhiễu hơn là kỹ thuật Sobel mặc dù nó có khả năng phát hiện khá tốt các vùng Nhưng cũng giống các phương pháp phát hiện biên trực tiếp khác là nó cho kết Ảnh số là một mảng số thực 2 chiều (Iij) có kích thước (MN), trong đó mỗi phần tử Iij(i = 1,...,M; j = 1,...,N) biểu thị mức xám của ảnh tại (i,j) tương ứng. Ảnh được gọi là ảnh nhị phân nếu các giá trị Iij chỉ nhận giá trị 0 hoặc 1. Ở đây ta chỉ xét tới ảnh nhị phân vì ảnh bất kỳ có thể đưa về dạng nhị phân bằng kỹ Ta ký hiệu  là tập các điểm vùng (điểm đen) và  là tập các điểm Giả sử (i,j) là một điểm ảnh, các điểm 4-láng giềng là các điểm kề trên, dưới, trái, Trong Hình 3.1 biểu diễn ma trận 8 láng giềng kề nhau, các điểm P0, P2, P4, P6 là các trong E nếu tồn tại tập các điểm được gọi là đường đi sao cho (io,jo)= Ps, Quan hệ k-liên thông trong E (k=4,8) là một quan hệ phản xạ, đối xứng và bắc cầu. Về sau ta sẽ gọi mỗi thành phần k-liên thông của ảnh là một đối Chu tuyến của một đối tượng ảnh Chu tuyến của một đối tượng ảnh là dãy các điểm của đối tượng ảnh P1,,Pn sao cho Pi và Pi+1 là các 8-láng giềng của nhau và P1 là 8-láng giềng của Pn, i Q không thuộc đối tượng ảnh và Q là 4-láng giềng của Pi. Kí hiệu các khoảng cách giữa hai điểm kế tiếp của chu tuyến là độ dài của chu tuyến và kí hiệu Len(C) và hướng PiPi+1 là hướng chẵn nếu Pi và Pi+1 là các 4 – láng giềng (trường hợp Hình 4.6 dưới đây biểu diễn chu tuyến của ảnh, trong đó, P là (ii) Các điểm Pi là vùng thì Qj là nền và ngược lại. Chu tuyến C được gọi là chu tuyến ngoài (Hình 4.7a) nếu và chỉ nếu (i) Chu tuyến đối ngẫu C là chu tuyến của các điểm nền Chu tuyến C được gọi là chu tuyến trong (Hình 4.7b) nếu và chỉ nếu: (i) Chu tuyến đối ngẫu C là chu tuyến của các điểm nền Giả sử C= là chu tuyến của một đối tượng ảnh và P là một điểm ảnh. là điểm trong chu tuyến C và kí hiệu in(P,C) (ii) Nếu PC và P không phải là điểm trong của C, thì P được gọi là điểm ngoài chu Giả sử E   là một đối tượng ảnh và C= < P1P2..Pn> là chu tuyến của E, Giả sử E   là một đối tượng ảnh và C là chu tuyến của E. (i) Nếu C là chu tuyến ngoài thì x  E sao cho xC, ta có in(x,C) (ii) Nếu C là chu tuyến trong thì x  E sao cho xC, ta có out(x,C) Giả sử E   là một đối tượng ảnh và CE là chu tuyến ngoài của E. Biểu diễn đối tượng ảnh theo chu tuyến thường dựa trên các kỹ thuật dò biên. Kỹ thuật thứ nhất xét ảnh biên thu được từ ảnh vùng sau một lần trên ảnh vùng, kết hợp đồng thời quá trình dò biên và tách hết, giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8-liên thông , được bao Về cơ bản, các thuật toán dò biên trên một vùng đều bao gồm các bước sau: Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên, và quan hệ Kết quả tác động của toán tử dò biên lên một điểm biên ri là điểm biên ri+1 (8-láng Thông thường các toán tử này được xây dựng như một hàm đại số Boolean điểm này tạo nên tập nền vùng, kí hiệu là NV và phân tích toán tử dò biên thành 2 bước: Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập NV lên NV và Việc xác định cặp nền-vùng xuất phát được thực hiện bằng cách duyệt ảnh lần lượt từ điểm biên chỉ mang tính chất quy ước, nên ta gọi ánh xạ xác định cặp nền-vùng tiếp theo là Gọi T là một toán tử dò biên cơ sở nếu nó thoả mãn điều kiện: b’,r’ là các 8-láng Giả sử (b,r)  NV; gọi K(b,r) là hàm chọn điểm của một dạng  có thể  Tập những điểm thuộc  có mặt trên NV, tức là K(b,r)= r  Tập những điểm thuộc  có trên NV, tức là K(b,r)= b Cách định nghĩa thứ ba tương ứng mỗi cặp nền-vùng với một điểm biên. với cách định nghĩa thứ nhất và thứ hai một số cặp nền-vùng có thể có chung một điểm Cặp nền vùng xuất phát được xác định bằng cách duyệt ảnh lần lượt từ trên xuống dưới và từ trái sang phải điểm đem đầu tiên gặp được cùng với điểm trắng trước đó (theo Để tính giá trị cho hướng tiếp theo ta lập bảng dựa trên giá trị pdir đã tính được trước 0 � 0 � 0 � 0 � điểm của ảnh X sau khi đ Ví dụ: Với tập X và B trong ví d Phần lớn các phép toán của "Hình thái" được định nghĩa từ hai phép toán c Các phép toán này được định nghĩa như sau: Giả thiết ta có đối t ở" của X theo mẫu B là hợp của tất cả các Bx với ủa X theo B là tập hợp tất cả các điểm x sao cho B 0 0 0 � 0 0 � 0 0 � 0 0 ở (OPEN) của X theo cấu trúc B là tập hợp các ểm của ảnh X sau khi đã co và giãn nở liên liếp theo B. và B trong ví dụ trên ta có ả thiết ta có đối tượng X và phần tử Phép toán đóng (CLOSE) của X theo cấu trúc B là tập hợp các điểm của ảnh X sau ập hợp các điểm của ảnh X sau Từ (4.1) và (4.2) ta có: X  (B B’) = (X  B)  (X  B’) Từ (4.3) và (4.4) ta có: X  (B  B’) = (X  B)  (X  B’). Ta có thể phân tích các mẫu phức tạp trở thành các mẫu đơn giản thuận tiện cho việc Từ (4.5) và (4.6) ta có: (X  Y)  B = (X  B)  (Y  B). Giả sử, X là một đối tượng ảnh, B là mẫu, khi đó, X sẽ bị chặn trên bởi tập CLOSE Từ (4.7) và (4.8) Ta có: (X  B)  B  X  (X  B)  B. (i) Thật vậy, từ định lý 4.2 ta có X  (X  B) Ө B Mặt khác, cũng từ định lý 4.2 ta có (X  B)  B  X X Từ (4.9) và (4.10) Ta có: ((X  B) B)  B = X  B (ii) Thật vậy, từ định lý 4.2 ta có (X  B)  B  X Mặt khác, cũng từ định lý 4.2 ta có X  (X  B) Ө B X Từ (4.11) và (4.12) Ta có: ((X  B)  B)  B = XB là vấn đề quan trọng trong xử lý ảnh và nhận dạng, vì các đặc điểm trích chọn cập đến một tiếp cận mới trong phát hiện biên dựa vào các phép toán hình thái thông qua Cũng đã có một vài tác giả đề cập đến kỹ thuật phát hiện biên dựa vào phép toán Nhưng các kỹ thuật phát hiện biên trực tiếp, gián tiếp và dựa vào các phép toán hình thái kể trên đều xuất phát từ quan điểm biên của đối tượng là một tập hợp con của đối kỹ thuật phát hiện biên dựa vào phép toán hình thái theo quan niệm này, xuất phát từ cơ sở Biên (hay đường biên) có thể hiểu đơn giản là các đường bao của các đối tượng trong ảnh chính là ranh giới giữa đối tượng và nền. các điểm thuộc đối tượng và thuộc nền cho phép ta xác định biên dựa trên các phép toán Như vậy, tập = (XB)B có thể được xem như là xấp xỉ trên của tập Xấp xỉ trên và dưới theo mẫu B của X Do vậy, tập OPEN(X,B) = (XB)B có thể được xem như là xấp xỉ dưới của tập X Từ đó, tập OPEN(X,B) có thể được xem như là xấp xỉ biên của tập X theo mẫu và quá trình xấp xỉ biên của X theo mẫu B kí hiệu là X B. Để tăng độ chính xác, người ta thường xem B là dãy các phần tử cấu trúc. Và xấp xỉ biên của X theo tập cấu trúc B được xác định: Vào : Ảnh X và dãy mẫu B= {Bi, 1 i  n }; Trong Hình 4.9a dưới đây là ảnh gốc với 256 mức xám, Hình 4.9b là ảnh biên thu được qua phát hiện biên bằng Sobel, Hình 4.9c là ảnh biên thu được qua phát hiện biên Hình 4.9d là ảnh biên kết quả thực hiện bởi thuật toán phát hiện biên bằng các phép toán hình thái với ngưỡng tách  = 128 và các mẫu tách biên Bi là: a) Ảnh gốc đa cấp xám b) Ảnh biên thu được qua Sobel c) Ảnh biên thu được qua Laplace d) Ảnh biên kết quả dựa vào phép toán một ma trận ảnh đa cấp xám (0-255)và đầu ra là ảnh với chỉ hai loại điểm ảnh, điểm nền có giá trị là 0 và điểm biên có giá trị là 255. Câu 3: Thực hiện phép co và dãn hình X với một phần tử cấu trúc B sau để được hai Được biết tâm của B là ở chính giữa. Câu 4: Thực hiện phép đóng và mở hình X với một phần tử cấu trúc B ở câu 3 để Được biết tâm của B là ở Xử lý ảnh bao gồm các bước: thu nhận ảnh, tiền xử lý, phân đoạn ảnh, biểu diễn và giải thích, nhận dạng và mô tả (tuy nhiên không phải ứng dụng xử lý ảnh nào cũng phải có Trong các bước đó, bước phân đoạn ảnh là bước quan trọng thuật phân đoạn: ảnh màu hoặc đa mức xám thì cần phải phân ngưỡng; muốn nhận dạng được các đối tượng thì trước hết cần phải phân ảnh thành các vùng khác nhau chứa các đối tượng trong ảnh: tách ra vùng là chữ, số trên bì thư hoặc fax trong phân loại thư, fax tự động; tách ra các vùng là chữ, hình ảnh, bảng biểu … trong các ứng dụng nhập dữ liệu tự Hình dáng của một đối tượng có thể được miêu tả hoặc bởi các tham số của đường phân đoạn ảnh thành một số vùng đồng nhất. Như vậy, phát hiện biên và phân vùng là hai Các vùng ảnh yêu cầu phải có các đặc tính đặc trưng được sử dụng trong suốt quá trình phân đoạn theo các nguyên tắc kiểm tra tính Chúng ta hãy giả sử rằng một miền ảnh X phải được phân đoạn thành N vùng khác nhau: R1, …, RN và nguyên tắc phân đoạn là một vị từ của công thức P(R). và các vùng của nó R1, …, RN có thể được miêu tả một cách tiện lợi bởi các tập con của Việc phân đoạn ảnh chia tập X thành các tập con Ri, i = 1..N Những vùng Ri, i=1..N phải lấp kín hoàn toàn ảnh, nó được thể hiện trong tính chất P(Ri) phải là TRUE trên mỗi vùng Ri để bảo đảm tính đồng nhất của vùng, có thể được với một vùng ảnh không đồng nhất. P thường là một vị từ của công thức P(R,x,t), trong đó x là vectơ đặc trưng gắn với một điểm ảnh và t là một tập hợp các tham số (thường là các hợp đơn giản nhất, vectơ đặc trưng x chỉ có cường độ ảnh f(k,l) và vectơ ngưỡng chỉ gồm Trong trường hợp các ảnh màu, vectơ đặc trưng x có thể là ba thành phần ảnh RGB Một nguyên tắc phân đoạn ảnh đơn giản có thể có công thức: Một vùng R được gọi là liên thông nếu bất kỳ hai điểm (xA,yA) và (xB,yB) Một điểm (xk,yk) được gọi là kề với điểm 4-láng giềng của một điểm (x,y) là một tập hợp bao gồm láng giềng dọc và 8-láng giềng của (x,y) là một tập cha của 4-láng giềng và bao gồm láng giềng ngang, Các đường được xác định bằng cách sử dụng 4-láng giềng gồm có các vệt dọc và Các kỹ thuật phân đoạn có thể chia thành ba lớp khác dựa vào các thuộc tính cục bộ của các điểm và láng giềng của nó. kỹ thuật toàn thể (global) phân ảnh dựa trên thông tin chung của toàn bộ ảnh (ví dụ bằng một số phương pháp phân đoạn ảnh cụ thể. PHÂN VÙNG ẢNH THEO NGƯỠNG BIÊN ĐỘ Trong hầu hết các trường hợp, ngưỡng được chọn từ lược đồ độ sáng của vùng hay {h[b] | b = 0, 1,..., B-1} đã được đưa ra, B là số mức xám của ảnh, với ảnh grayscale  là giá trị tần xuất của độ sáng b sau khi làm trơn  hraw[b] là giá trị tần xuất của độ sáng b gốc Đây là kỹ thuật chọn ngưỡng theo kiểu lặp do Ridler và Calvard đưa ra.  Trước hết, lược đồ sẽ được phân đoạn thành hai phần bằng một giá trị ngưỡng khởi động với 0 = B/2 tức là bằng phân nửa thang độ xám động của ảnh.  Sau đó, các trung bình mẫu (mf,0) của những điểm ảnh thuộc đối tượng và (mb,0) của những điểm ảnh nền sẽ được tính toán.  Một giá trị ngưỡng mới 1 sẽ được tính kế đó bằng cách lấy giá trị trung bình của  Quá trình này cứ thế sẽ được tiếp tục với ngưỡng mới cho đến khi nào giá trị � = Kỹ thuật này dựa trên sự giả định là tồn tại hai đỉnh phân biệt trong lược đồ nằm đối xứng nhau qua đỉnh có giá trị lớn nhất trong phần lược đồ thuộc về các điểm ảnh này có thể tận dụng ưu điểm của việc làm trơn được mô tả trong phương trình sẽ được áp dụng ở phía không phải là điểm ảnh thuộc đối tượng ứng với giá trị cực đại Hàm phân phối xác suất P(a) thể hiện xác suất chọn được một giá trị độ sáng từ một vùng ảnh cho trước, sao cho giá trị này không vượt quá một giá trị sáng cho trước a. Ở đây ta đang giả thiết là ảnh có các đối tượng tối trên nền sáng. là 95%, thì có nghĩa là ta phải ở bên phải đỉnh maxp một giá trị a sao cho đối xứng đã giả định ở trên, chúng ta lấy đối xứng qua maxp để có được ngưỡng T: Kỹ thuật này thực hiện ngược lại với tình huống ảnh có các đối tượng sáng trên một thuật toán như sau: Nối đường thẳng  từ điểm Hmax của lược đồ (điểm có histogram lớn nhất, có mức xám bmax) đến điểm Hmin của lược đồ (điểm ứng với độ sáng nhỏ nhất mỗi độ sáng b trong khoảng [bmax, bmin], chúng ta đi tính khoảng cách d từ điểm Hb của Kỹ thuật này đặc biệt hiệu quả khi các điểm ảnh thuộc đối Nếu ảnh chứa một đối tượng và một nền có cường độ đồng nhất, nó thường có một Điểm cực đại địa phương của histogram có thể dễ dàng được phát hiện nền sáng mà phép biến đổi top hat sẽ có một trong hai dạng sau: Trong một số ứng dụng nhất định, cường độ của đối tượng hay nền thay đổi khá Trong trường hợp này, histogram ảnh có thể không chứa hai thuỳ phân biệt rõ ràng, Kỹ thuật phân đoạn ảnh thành các miền đồng nhất dựa vào các thuộc tính quan trọng Mỗi một thuộc tính khi sử dụng thì có một tiêu chuẩn phân đoạn tương Một số thuộc tính tiêu biểu là: mức xám, màu sắc (đối với ảnh màu), kết cấu thành n vùng khác nhau: Z1, Z2,..., Zn và lôgic vị từ có dạng P(Z). Kết quả của việc phân đoạn ảnh phụ thuộc vào dạng của vị từ P và các đặc tính biểu Thường vị từ P có dạng P(Z, X, t), với X là véc tơ đặc tính, t là Trường hợp đơn giản nhất, véc tơ đặc tính chỉ chứa giá trị mức xám của ảnh I(k, t) Với ảnh màu, véc tơ đặc tính X có thể là thành phần ba màu R, G, B và IR(k,l), Có ba cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất và độc lập với Mức độ hiệu quả của các phương pháp là phụ thuộc vào việc lựa chọn tiêu chuẩn là giá trị mức xám lớn nhất và nhỏ nhất trong miền đang xét. �̅ là giá trị trung bình trong vùng ảnh đang xét. /* Giả sử là ảnh có tối đa 255 mức (N2, M2) là toạ độ điểm đầu và điểm cuối của miền, T là Giả sử là ảnh có tối đa 255 mức M2) là toạ độ điểm đầu và điểm cuối của miền, T là ngưỡng.*/ Nếu hàm trả về giá trị 0, có nghĩa vùng đang xét là đồng nhất, trường hợp ngược lại Trong giải thuật trên, khi miền là đồng nhất cần tính lại giá Hình 5.4 a-e minh họa thuật toán tách cây tứ phân: ảnh gốc (a) được chia thành 4 phần được kết quả phân mức 1 (b), tiếp tục thực hiện đối với các phần nhỏ, ta được phân Nếu mọi điểm của vùng là màu trắng sẽ tạo Ý tưởng của phương pháp này là xem xét ảnh từ các miền nhỏ nhất rồi hợp chúng lại Miền nhỏ nhất của bước xuất phát là điểm xử lý ảnh người ta dùng khái niệm liên thông để xác định kế một điểm ảnh I (x,y) sẽ có 4 kế cận theo hướng x, y. điểm ảnh I(x, y) sẽ có 4 liên thông theo hai hướng x và y và 4 liên thông khác theo hướng Ri có n điểm có giá trị trung bình mi và độ lệch tiêu chuẩn Hai vùng R1 và R2 có thể hợp nếu | m1 - m2 | < T và điểm I(k, l) hợp với vùng Ri nếu một trong các vùng lân cận Ri. Nếu việc hợp không thành công thì ta hợp với các vùng Nếu hợp R (k, l) là thành công, cập nhật lại giá trị trung bình và độ lệch Nếu có nhiều hơn một vùng lân cận thoả mãn thì hợp điểm với vùng Ri có sự khác Hai phương pháp vừa xét ở trên có một số nhược theo tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu Với phương pháp này ta thu được miêu tả cấu trúc của ảnh với các miền liên thông i. Nếu không thoả và số điểm trong vùng lớn hơn một điểm, tách làm 4 Phương pháp này thu được kết quả số vùng là nhỏ hơn phương pháp tách và ảnh Việc phân đoạn ảnh dựa vào biên được tiến hành qua một số bước: Về mặt toán học, người ta coi điểm biên của ảnh là điểm có sự biến đổi đột ngột về  Đường biên lý tưởng (Hình 5.5 a) được định nghĩa là sự thay đổi giá trị cấp xám  Đường biên thực (Hình 5.5 c): Đó là sự thay đổi cấp xám tại nhiều điểm nhưng Định nghĩa toán học của biên ở trên là cơ sở cho các kỹ thuật phát hiện trọng là biến thiên giữa các điểm ảnh thường là nhỏ, trong khi đó biến thiên độ sáng kỹ thuật Laplace dùng trong việc phát hiện biên cho kết quả trực tiếp biên ảnh với độ rộng Còn với các kỹ thuật khác, ví dụ như kỹ thuật Gradient thì không như vậy, ta phải có bước làm mảnh biên để thu được biên với độ rộng 1 thực hiện đạo hàm một ảnh, ta thu được những điểm cực trị cục bộ. thuật Gradient, những điểm cực trị cục bộ có thể coi như cực trị đó để xác định chính xác biên ảnh và để giảm độ rộng biên phương pháp hay dùng đó là phương pháp “Loại bỏ các điểm không cực này cũng giải thích tại sao phân đoạn dựa theo biên có hiệu quả khi ảnh định ra một ngưỡng nào đó và sau đó sử dụng một hệ số sinh thích nghi thông qua lời giải Khi đã có bản đồ biên ảnh, ta cần phải biểu diễn nó dưới dạng thích hợp phục vụ cho Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải vóc…Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử sợi (texel) cơ phân tích ảnh, kết cấu được chia làm hai loại chính là: loại thống kê và loại Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính. đồ bậc một của ε (m,n) chẳng hạn như trung bình m1, độ phân tán 2 μ cũng hay được Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định nghĩa các đại Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không gian và được Cho d=(d1, d2) là vecto dịch chuyển giữa 2 điểm ảnh và g(d) là hiệu Với một miền ảnh có kết cấu thô, lược đồ hg(g, d) có khuynh hướng tập trung xung Trái lại, với một miền ảnh có kết cấu mịn, hg(g, d) sẽ Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản. Giả sử P(k,l,d) là xác suất liên hiệp của hai điểm ảnh fk và f1 với các mức xám k,l xuất hiện nk,l của cặp điểm ảnh (fk, f1) có mức xám k và l với khoảng cách d. số cặp liên hiệp có thể với khoảng cách d trong ảnh. kết cấu tương đối thô thì các phần tử của ma trận tập trung xung quanh đường chéo lại, nếu kết cấu bề mặt mịn, giá trị các phần tử của cd sẽ phân rải tương đối rõ. Id cực tiểu khi các phân tử của ma trận C tập trung trên đường chéo chính vì khoảng Kết cấu sợi có cấu trúc thuần nhất là những texels xác định, mà sự xuất hiện lặp đi nhóm các điểm ảnh có cùng một số tính chất bất biến lặp trên theo mức xám, theo bề mặt hay tính đồng nhất đối với một số các tính chất như kích Với các texel được phân bố ngẫu nhiên, tính kết cấu sợi tương ứng của nó được coi  Mật độ cực trị tương đối; số pixel trên một đơn vị diện tích có mức xám cực trị hợp 2 cách trên và gọi là kỹ thuật đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa vào đoạn dựa vào miền đồng nhất cũng có thể áp dụng cho các đặc trưng kết cấu và có thể dùng để phân đoạn các miền có tính kết cấu. Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức tạp. Câu 3: Thực hiện tìm ngưỡng tự động với thuật toán đẳng liệu cho bức ảnh I có biểu Được biết ảnh có 10 Nhận dạng là quá trình phân loại các đối tượng biểu diễn theo một mô hình nào đó và gán chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những guy luật và các Khi mô hình biểu diễn đối tượng đã được xác định, có thể là định lượng (mô hình Việc nhận dạng chính là tìm ra quy luật và các thuật toán để có thể gán đối tượng vào Kỹ thuật phân loại nhờ kiến thức biết trước gọi là Học có giám sát. bản của kỹ thuật này là người ta có một thư viện các mẫu đối sánh đối tượng trong ảnh với mẫu chuẩn và quyết định gán cho chúng vào một lớp. Việc đối sánh nhờ vào các thủ tục ra quyết định dựa trên một công cụ gọi là hàm phân lớp Kỹ thuật học này phải tự định ra các lớp khác nhau và xác định các tham số đặc tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm phân lớp và nâng cấp dần để đạt được một Nhìn chung, dù là mô hình nào và kỹ thuật nhận dạng ra sao, một hệ thống nhận Trong kỹ thuật này, các đối tượng nhận dạng là các đối tượng định phân hoạch không gian, hàm phân biệt sau đó sẽ đi vào một số kỹ thuật cụ thể. Giả sử không gian đối tượng X được định nghĩa: X = {Xi, i=1, 2,...,m}, Xi là một Người ta nói P là một phân hoạch của không gian X thành các lớp Ci, Ci  X nếu: