Đề án Tìm hiểu một số phương pháp phát hiện đối tượng đột nhập

pdf 57 trang yendo 5530
Bạn đang xem 20 trang mẫu của tài liệu "Đề án Tìm hiểu một số phương pháp phát hiện đối tượng đột nhập", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfde_an_tim_hieu_mot_so_phuong_phap_phat_hien_doi_tuong_dot_nh.pdf

Nội dung text: Đề án Tìm hiểu một số phương pháp phát hiện đối tượng đột nhập

  1. Đề án tốt nghiệp Tìm hiểu một số phương pháp phát hiện đối tượng đột nhập
  2. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p /ӠI CҦM ѪN Sau thӡi gian thӵc tұp và nghiên cӭu tҥi trѭӡng ĈHDL Hҧi Phòng em ÿã hoàn thành viӋc tìm hiӇu ÿӅ tài: Tìm hiӇu mӝt sӕ phѭѫng pháp phát hiӋn ÿӕi Wѭӧng ÿӝt nhұp, trong thӡi gian làm ÿӗ án tӕt nghiӋp em ÿã nhұn ÿѭӧc sӵ giúp ÿӥ hӃt sӭc nhiӋt tình cӫa Th.s Ngô Trѭӡng Giang và cùng vӟi sӵ nӛ lӵc cӫa Eҧn thân nên em ÿã hoàn thành ÿӅ tài ÿѭӧc giao. Em xin chân thành cҧm ѫn sӵ giúp ÿӥ cӫa các thҫy cô khoa công nghӋ thông tin, thҫy giáo Th.s Ngô Trѭӡng Giang và toàn thӇ các bҥn sinh viên khoa Công nghӋ thông tin, trѭӡng Ĉҥi hӑc Dân lұp Hҧi Phòng cùng vӟi gia ÿình ÿã ӫng hӝ giúp ÿӥ và tҥo mӑi ÿLӅu kiӋn thuұn lӧi cho em trong suӕt quá trình hӑc tұp và nghiên cӭu ÿӇ hoàn thành tӕt ÿӗ án tӕt nghiӋp này. +̫i Phòng, tháng 07 năm 2007 Sinh viên NguyӉn QuǤnh Nga Nguy͍n QuǤnh Nga – CT701 Trang 1
  3. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 0ӨC LӨC /ӠI CҦM ѪN 1 0ӢĈҪU 4 CHѬѪNG 1: 7ӘNG QUAN Vӄ XӰ LÝ VIDEO 5 1.1. Giӟi thiӋu 5 1.2. Các hiӋu ӭng biên tұp video 7 1.3. Các thuӝc tính ÿһc trѭng cӫa video 9 1.3.1. Color 9 1.3.2. Texture 9 1.3.3. Shape 10 1.3.4. Motion 10 1.4. Phân ÿRҥn video 10 1.5. .ӻ thuұt trӯҧnh 13 1.5.1. 'ӵa vào so sánh ÿLӇm ҧnh 14 1.5.2. 'ӵa vào khӕi 16 1.5.3. 'ӵa vào so sánh biӇu ÿӗ 18 1.5.4. 'ӵa vào phѭѫng pháp thӕng kê 23 CHѬѪNG 2: MӜT SӔ PHѬѪNG PHÁP PHÁT HIӊN CHUYӆN ĈӜNG 25 2.1. 7әng quan phѭѫng pháp trӯ nӅn 25 2.1.1. Giӟi thiӋu 25 2.1.2. Giҧi thuұt trӯ nӅn 26 2.1.2.1. TiӅn xӱ lí 27 2.1.2.2. Mô hình hóa nӅn 27 2.1.2.3. Phát hiӋn ÿӕi tѭӧng 32 2.1.2.4. +ӧp lí hoá dӳ liӋu 33 2.2. Trӯ nӅn sӱ dөng thông tin màu và gradiant 35 2.2.1. Giӟi thiӋu 35 2.2.2. Mô hình hóa nӅn 35 2.2.3. Trӯ nӅn 36 Nguy͍n QuǤnh Nga – CT701 Trang 2
  4. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 2.2.3.1. Trӯ nӅn dӵa vào màu 37 2.2.3.2. Trӯ nӅn dӵa vào biên 38 2.2.3.3. .Ӄt hӧp các kӃt quҧ trӯ màu và trӯ biên 39 2.2.4. Nhұn xét 40 2.3. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa vào kӃt cҩu 40 2.3.1. Giӟi thiӋu 40 2.3.2. Toán tӱ mүu nhӏ phân cөc bӝ 41 2.3.3. Phѭѫng pháp phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng 42 2.4. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa vào sӵ biӃn thiên cөc bӝ cӫa véctѫ kӃt cҩu SP 45 2.4.1. Giӟi thiӋu 45 2.4.2. BiӇu diӉn video vӟi vectѫ kӃt cҩu SP 47 2.4.3. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa trên biӃn thiên cөc bӝ 48 CHѬѪNG 3: THӰ NGHIӊM PHÁT HIӊN ĈӔI TѬӦNG ĈӜT NHҰP 50 3.1. Mô tҧ bài toán 50 3.2. Môi trѭӡng test 50 3.3. 0ӝt sӕ giao diӋn 50 3.4. Ĉánh giá 52 .ӂT LUҰN 54 TÀI LIӊU THAM KHҦO 55 Nguy͍n QuǤnh Nga – CT701 Trang 3
  5. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 0ӢĈҪU Ngày nay, sӵ phát triӇn cӫa công nghӋ thông tin ÿã xâm nhұp vào Kҫu hӃt các mһt cӫa ÿӡi sӕng xã hӝi vӟi nhӳng ӭng dөng rӝng rãi hӛ trӧ cho con ngѭӡi trên nhiӅu lƭnh vӵc, trong ÿó có lƭnh vӵc an toàn an ninh, chӕng xâm nhұp.ViӋc ÿҧm bҧo an ninh là mӝt vҩn ÿӅ quan trӑng và cҫn thiӃt (Vd : Trong các nút giao thông quan trӑng, trong các siêu thӏ, trong các ngân hàng hay bҧo tàng là nhӳng nѫi mà vҩn ÿӅ an ninh ÿѭӧc ÿһt lên hàng ÿҫu ). Có nhiӅu phѭѫng pháp nhҵm ÿҧm bҧo an ninh sao cho ÿҥt ÿѭӧc hiӋu quҧ cao, trong ÿó có phѭѫng pháp áp dөng các hӋ thӕng camera ÿӇ quan sát sӵ chuyӇn ÿӝng cӫa các ÿӕi tѭӧng trong khu vӵc. Ngày nay vӟi sӵ tiӃn bӝ vѭӧt Eұc cӫa khoa hӑc, ta có thӇ xây dӵng mӝt hӋ thӕng cҧnh báo tӵÿӝng phát hiӋn ÿӕi tѭӧng ÿӝt nhұp mà không cҫn con ngѭӡi phҧi trӵc tiӃp theo dõi camera, ÿLӅu này giúp cho con ngѭӡi giҧm thiӇu ÿѭӧc thӡi gian và sӭc lӵc ÿӗng thӡi vүn cho mӝt kӃt quҧ chính xác. 9ӟi bài toán phát hiӋn ÿӕi tѭӧng ÿӝt nhұp có 2 hѭӟng tiӃp cұn ÿӇ giҧi quyӃt ÿó là: dӵa vào phҫn cӭng và dӵa vào các kƭ thuұt xӱ lý ҧnh. Trong ÿӗ án tӕt nghiӋp này em xin trình bày mӝt sӕ phѭѫng pháp phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng trong ÿRҥn video dӵa vào các kƭ thuұt xӱ lí ҧnh. Cҩu trúc cӫa bài khóa luұn gӗm phҫn mӣÿҫu, phҫn kӃt luұn, phҫn phө lөc và 3 chѭѫng vӟi nӝi dung: Chѭѫng 1: Trình bày tәng quan vӅ video và các kƭ thuұt trӯҧnh . Chѭѫng 2: Mӝt sӕ phѭѫng pháp phát hiӋn chuyӇn ÿӝng trong video. Chѭѫng 3: Chѭѫng trình ӭng dөng phát hiӋn ÿӕi tѭӧng ÿӝt nhұp. Nguy͍n QuǤnh Nga – CT701 Trang 4
  6. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p CHѬѪNG 1: 7ӘNG QUAN Vӄ XӰ LÝ VIDEO 1.1. Giӟi thiӋu 'ӳ liӋu video sӕ ngày càng ÿѭӧc sӱ dөng rӝng rãi. 'ӳ liӋu video sӕ bao Jӗm hình ҧnh và âm thanh video ÿѭӧc lѭu trӳ trong máy tính dѭӟi dҥng sӕ. Trѭӟc tiên ta tìm hiӇu video sӕ là gì? Video sӕ hay Video là tұp hӧp các khung hình ÿѭӧc ÿһt liên tiӃp nhau, mӛi khung hình là mӝt ҧnh sӕ. video Scene 1 Scene 2 Scene n Shot 1 Shot 2 Shot n Frame 1 Frame 2 Frame n Hình 1.1: &ҩu trúc phân ÿRҥn cӫa video Frame (khung ) : Video ÿѭӧc tҥo nên bӣi chuӛi các ҧnh tƭnh. Mӝt chuӛi các khung tƭnh ÿһt cҥnh nhau tҥo nên các cҧnh phim chuyӇn ÿӝng. Mӝt khung ÿѫn là mӝt ҧnh tƭnh Khung hình i khung hình i+1 Hình 1.2: Các khung hình Nguy͍n QuǤnh Nga – CT701 Trang 5
  7. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p çӇÿRҥn video có thӇ tҥo cҧm giác chuyӇn ÿӝng, các khung hình phҧi ÿѭӧc quay vӟi tӕc ÿӝ phù hӧp. Mҳt ngѭӡi chӍ có thӇ nhұn ÿѭӧc 24 hình/giây, QӃu nhѭ lҫn lѭӧt 24 hình hoһc nhiӅu hѫn 24 hình ÿѭӧc phát trong mӝt giây thì Pҳt sӁ không nhұn ra ÿѭӧc sӵ rӡi rҥc giӳa nhӳng khung hình, mà chӍ thҩy nhӳng cҧnh liên tөc. Có nhiӅu hӋ video và mӛi hӋ có tӕc ÿӝ quay khác nhau nhѭ : NTSC 30 hình/giây, PAL 24 hình/giây, SECAM 29.99 hình/giây. Khung hình là ÿѫn vӏ cѫ bҧn nhҩt cӫa dӳ liӋu video. Theo chuҭn cӫa hӋ NTSC thì mӝt giây có 30 khung hình, vұy mӝt phút có 1800 khung hình, mӝt giӡ có 60x1800 = 108000 khung hình. Có thӇ thҩy rҵng sӕ lѭӧng khung hình cho mӝt ÿRҥn video thѭӡng là rҩt lӟn, cҫn phҧi có mӝt ÿѫn vӏ cҩp cao hѫn cho video sӕ. Shot (lia): là ÿѫn vӏ cѫ sӣ cӫa video. Mӝt lia là mӝt ÿѫn vӏ vұt lý cӫa dòng video, gӗm các chuӛi mӝt hay nhiӅu khung hình liên tiӃp, không thӇ chia nhӓ hѫn, ӭng vӟi mӝt thao tác camera ÿѫn. Nhӳng khung hình này liên tiӃp theo thӡi gian mô tҧ mӝt hành ÿӝng liên Wөc, và ÿѭӧc giӟi hҥn bӣi 2 chuyӇn cҧnh. Shot i Shot i+1 Shot i+2 Biên shot Biên shot ChuyӇn cҧnh Hình 1.3: ĈRҥn cѫ sӣ Nguy͍n QuǤnh Nga – CT701 Trang 6
  8. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 0ӝt ÿRҥn video có thӇ có nhiӅu ÿRҥn cѫ sӣ, mà cNJng có thӇ chӍ là mӝt ÿRҥn cѫ sӣ. Nhӳng ÿRҥn cѫ sӣÿҥi diӋn cho toàn bӝÿRҥn video, và truy xuҩt ÿӃn chúng cNJng coi nhѭ là truy xuҩt ÿӃn chính ÿRҥn video. Tә chӭc nhӳng ÿRҥn video ӣ mӭc ÿӝÿRҥn cѫ sӣ là thích hӧp nhҩt cho viӋc duyӋt và truy tìm thông tin dӵa vào nӝi dung. Scene (cҧnh ) : là các ÿѫn vӏ logic cӫa dòng video, mӝt cҧnh gӗm mӝt hay nhiӅu shot liên quan ÿӃn nhau vӅ không gian và liӅn kӅ vӅ thӡi gian, cùng mô tҧ mӝt nӝi dung ngӳ nghƭa hoһc mӝt tình tiӃt. Ngoài ra có thӇ biӇu diӉn cҩu trúc video dӵa trên ÿӕi tѭӧng: video Shot 1 Shot 2 Shot n object 1 object 2 object n Region 1 Region 2 Region n Color, texture, shap Feature Motion, trajectotry Spatial,temporal, stuctures Hình 1.4: BiӇu diӉn video dӵa trên ÿӕi tѭӧng 1.2. Các hiӋu ӭng biên tұp video 6ӕ các hiӋu ӭng video có thӇ là rҩt lӟn. Các chѭѫng trình biên tұp video Qәi tiӃng nhѭ Adobe Premiere hay Ulead MediaStudio có tӟi hàng trăm loҥi Nguy͍n QuǤnh Nga – CT701 Trang 7
  9. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p biên tұp ÿѭӧc tham sӕ hóa. Tuy nhiên trên thӵc tӃ, hѫn 99% các biên tұp ÿó ÿӅu nҵm trong ba loҥi: cҳt cӭng, fade và chӗng mӡ; ngoài ra còn có wipe. Ø &̷t cͱng: là sӵ biӃn ÿәi ÿӝt ngӝt tӯ cҧnh này sang cҧnh khác, nó xҧy ra giӳa hai khung hình. Ø Fade: là sӵ biӃn ÿәi dҫn dҫn giӳa mӝt cҧnh và mӝt ҧnh (fade out) hoһc là sӵ biӃn ÿәi dҫn giӳa mӝt ҧnh và mӝt cҧnh phim (fade in). Ø Ch͛ng mͥ: là sӵ biӃn ÿәi dҫn dҫn tӯ cҧnh cNJ sang cҧnh mӟi trong ÿó Fҧnh cNJÿѭӧc fade out và cҧnh mӟi ÿѭӧc fade in. Ø Wipe: là hiӋn tѭӧng cҧnh chҥy theo mӝt ÿѭӡng trên màn hình, trong khi ÿó cҧnh mӟi xuҩt hiӋn phía sau ÿѭӡng ÿó. Các hiӋu ӭng ÿó tҥo nên sӵ biӃn ÿәi cho các khung hình, tҥo nên các chuyӇn cҧnh. Cҳt cӭng tҥo nên chuyӇn cҧnh ÿӝt ngӝt; fade, chӗng mӡ và wipe Wҥo nên chuyӇn cҧnh dҫn dҫn. Hình 1.5: 0ӝt sӕ loҥi Wipe cѫ bҧn Nguy͍n QuǤnh Nga – CT701 Trang 8
  10. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 1.3. Các thuӝc tính ÿһc trѭng cӫa video 1.3.1. Color 9ӟi mӛi mӝt ҧnh ÿӅu có mӝt biӇu ÿӗ màu ÿӇ biӇu diӉn sӵ phân bӕ màu trong ҧnh, biӇu ÿӗ màu không phө thuӝc vào viӋc quay ҧnh, dӏch chuyӇn ҧnh, chiӅu nhìn ҧnh mà phө thuӝc vào vào hӋ màu và các phѭѫng pháp ÿӏnh lѭӧng ÿѭӧc dùng. (a) (b) (c) (d) Hình 1.6: BiӇu ÿӗ màu cӫa 4 loҥi ҧnh cѫ bҧn (a) ҧnh tӕi (b) ҧnh sáng (c)ҧnh tѭѫng phҧn thҩp (d) ҧnh tѭѫng phҧn cao 1.3.2. Texture Ĉây là mӝt ÿһc trѭng quan trӑng cӫa bӅ mһt, nѫi xҧy ra viӋc lһp lҥi mүu Fѫ bҧn. Có hai dҥng biӇu diӉn Texture phә biӃn: biӇu diӉn dҥng ma trұn ÿӗng thӡi và biӇu diӉn Tamura. - Ma trұn ÿӗng thӡi mô tҧ hѭӟng và khoҧng cách giӳa các ÿLӇm ҧnh, ta có thӇ trích chӑn ÿѭӧc các thӕng kê có ý nghƭa. Ngѭӧc lҥi, ngѭӡi ta thҩy rҵng entropi và mô-men chênh lӋch nghӏch ÿҧo lҥi có khҧ năng phân biӋt tӕt nhҩt. Nguy͍n QuǤnh Nga – CT701 Trang 9
  11. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p - BiӇu diӉn Tamura ÿѭӧc thúc ÿҭy nhӡ các nghiên cӭu vӅ tâm lí trong viӋc thu nhұn trӵc giác cӫa con ngѭӡi, nó bao gӗm các thuӝc tính ÿo tính thô, ÿӝ tѭѫng phҧn, hѭӟng, tính trѫn, tính cân ÿӕi và ÿӝ thô ráp. Các ÿһc tính này Uҩt quan trӑng trong viӋc tìm hiӇu nӝi dung ҧnh vì nó biӇu diӉn rҩt trӵc quan. 1.3.3. Shape Các ÿһc trѭng hình dáng có thӇÿѭӧc biӇu diӉn sӱ dөng phân tích hình dáng truyӅn thӕng nhѭ mô-men bҩt biӃn, mô tҧ Fourier, mô hình hӑc tөÿӝng quay lui và các thuӝc tính hình hӑc. Các ÿһc trѭng này có thӇÿѭӧc phân chia thành ÿһc trѭng toàn cөc và ÿһc trѭng cөc bӝ. - Ĉһc trѭng toàn cөc là ÿһc trѭng thuӝc tính thu ÿѭӧc tӯ toàn bӝ hình dáng ҧnh (VD: chu vi, tính tròn, hѭӟng trөc chính ). - Ĉһc trѭng cөc bӝ là ÿһc trѭng thu ÿѭӧc tӯ viӋc thao tác vӟi mӝt phҫn Fӫa ҧnh, không phө thuӝc vào toàn bӝҧnh. 1.3.4. Motion Là thuӝc tính quan trӑng cӫa video, thông tin vӅ chuyӇn ÿӝng có thӇ ÿѭӧc sinh ra bҵng các kӻ thuұt ghép khӕi hoһc luӗng ánh sáng. Các ÿһc trѭng chuyӇn ÿӝng: mô-men cӫa trѭӡng chuyӇn ÿӝng, biӇu ÿӗ chuyӇn ÿӝng, các tham sӕ chuyӇn ÿӝng toàn cөc có thӇÿѭӧc trích chӑn tӯ vectѫ chuyӇn ÿӝng. Các ÿһc trѭng mӭc cao phҧn ánh di chuyӇn camera nhѭ quét camera (pan), nghiêng (tilt), phóng to (zoom in), thu nhӓ (zoom out) cNJng có thӇÿѭӧc trích chӑn. 1.4. Phân ÿRҥn video Là quá trình phân tích và chia luӗng video dài thành các ÿѫn vӏ nhӓ nhѭ shot, quá trình này sӁ phân tích và phát hiӋn ranh giӟi các shot. Quá trình này FNJng ÿѭӧc coi nhѭ là viӋc phát hiӋn nhӳng chuyӇn cҧnh giӳa các ÿRҥn, xác ÿӏnh khung hình bҳt ÿҫu và khung hình kӃt thúc cӫa mӝt ÿRҥn cѫ sӣ. Nguy͍n QuǤnh Nga – CT701 Trang 10
  12. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p ĈRҥn cѫ sӣ 1 ĈRҥn cѫ sӣ 2 ĈRҥn cѫ sӣ 3 Biên ÿRҥn cѫ sӣ Biên ÿRҥn cѫ sӣ ChuyӇn cҧnh Hình 1.7: Biên ÿRҥn cѫ sӣ Trong nhӳng năm gҫn ÿây, nhӳng nghiên cӭu vӅ viӋc phát hiӋn tӵÿӝng ÿRҥn cѫ sӣ ngày càng phát triӇn, nhӳng ӭng dөng ngày càng nhiӅu và càng có nhiӅu thuұt toán ÿѭӧc công bӕ ÿӇ giҧi quyӃt vҩn ÿӅ phân ÿRҥn cѫ sӣ cho nhӳng mӭc ÿӝ phӭc tҥp khác nhau cӫa dӳ liӋu thұt. Các kӻ thuұt phân ÿRҥn có thӇÿѭӧc chia thành 3 loҥi: phân ÿRҥn dӵa vào ngѭӥng, phân ÿRҥn dӵa trên phát hiӋn cҥnh, phân ÿRҥn bҵng phѭѫng pháp nӣ vùng. Phân ÿRҥn dӵa vào ngѭӥng sӁ biӃn ÿәi mӝt ҧnh ÿҫu vào f thành mӝt ҧnh nhӏ phân ÿҫu ra g dӵa trên mӝt ngѭӥng T cho trѭӟc nhѭ sau: ì1 for f ()i, j ³T g(i, j) = í (1.1) î0 for f (i, j)<T 9ӟi i và j là các tӑa ÿӝ X và Y, g(i,j) =1 chӍ ra rҵng ÿLӇm ҧnh (i,j) thuӝc YӅÿӕi tѭӧng và ngѭӧc lҥi g(i,j)= 0 chӍ ra rҵng ÿLӇm ҧnh thuӝc vӅ nӅn. T là giá trӏ ngѭӥng trong không gian ÿһc trѭng. Vӟi mӝt sӕ ngѭӥng cho trѭӟc ta có thӇ chia mӝt ҧnh thành các ÿӕi tѭӧng. Hoһc mӝt phѭѫng pháp phân ÿRҥn khác cNJng dӵa vào ngѭӥng là: rút trích các ÿһc trѭng cӫa mӛi khung hình trong ÿRҥn video, rӗi tính toán sӵ khác biӋt giӳa ÿһc trѭng cӫa các khung hình liên tiӃp, sau ÿó so sánh nhӳng khác biӋt này vӟi mӝt ngѭӥng cho trѭӟc. Mӛi khi sӵ khác biӋt vѭӧt quá ngѭӥng thì có nghƭa là tìm thҩy ÿѭӧc mӝt ÿRҥn cѫ sӣ. Tӯ vҩn ÿӅ sӱ dөng ÿһc Nguy͍n QuǤnh Nga – CT701 Trang 11
  13. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p trѭng nào cӫa khung hình, và sӱ dөng nhѭ thӃ nào ÿã nҧy sinh ra nhiӅu phѭѫng pháp, hѭӟng tiӃp cұn khác nhau. Hình 1.8: Tính khác biӋt ÿһc trѭng giӳa nhӳng khung hình liên tiӃp Hình 1.9: Ĉѭӡng sai biӋt vӅÿһc trѭng lѭӧc ÿӗ giӳa các khung hình liên tiӃp .ӻ thuұt phân ÿRҥn dӵa trên phát hiӋn cҥnh dùng các ÿLӇm ҧnh ÿӇ tìm biên ÿӕi tѭӧng. Cҥnh là dӳ liӋu có tҫn sӕ cao chӍ sӵ không liên tөc cӫa màu Vҳc trong mӝt ҧnh. Làm thӃ nào ÿӇ phân biӋt giӳa các cҥnh và nhiӉu là mӝt Yҩn ÿӅ khó cӫa các thuұt toán tìm cҥnh. Mӝt sӕ lӟn các phѭѫng pháp ÿã ÿѭӧc giӟi thiӋu ÿӇ theo vӃt các biên ÿӕi tѭӧng hoһc ÿӇ nӕi các mô hình hình dҥng mong muӕn. Hình 1.10: Các kӃt quҧ phát hiӋn cҥnh cӫa mӝt ҧnh Nguy͍n QuǤnh Nga – CT701 Trang 12
  14. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Do viӋc phát sinh nhiӉu tӵ nhiên cӫa phѭѫng pháp phát hiӋn cҥnh, viӋc xây dӵng nên các ÿӕi tѭӧng bҵng cách tìm kiӃm biên cӫa chúng gһp nhiӅu khó khăn. Các phѭѫng pháp nӣ vùng sinh ra các phân vùng mӝt cách trӵc tiӃp Gӵa trên các chuҭn ÿӗng nhҩt (vd: màu sҳc). Hѭӟng tiӃp cұn dѭӟi-lên gom các ÿLӇm ҧnh vào các vùng nӃu thӓa mãn ÿӝÿo ÿӗng nhҩt. Trái lҥi, hѭӟng tiӃp Fұn trên-xuӕng chia ҧnh thành các vùng cho ÿӃn khi thӓa mãn các ÿӝÿo ÿӗng nhҩt. Các hѭӟng tiӃp cұn tәng hӧp chia-và-trӝn kӃ thӯa, và phát triӇn nhӳng ѭu ÿLӇm cӫa hai phѭѫng pháp trên. Hình 1.11: 0ӝt ví dө phân ÿRҥn ҧnh bҵng phѭѫng pháp nӣ vùng Các kӻ thuұt phân ÿRҥn tiên tiӃn ÿѭӧc phát triӇn trong cҧ ba loҥi trên nhҵm cho kӃt quҧ phân ÿRҥn tӕt hѫn. Mӝt sӕ ví dөÿã biӃt nhѭ các thuұt toán watershed dùng các hình thái toán hӑc ÿӇ nӣ vùng, mҥng neural hӑc các thông tin ngӳ cҧnh tӯ dӳ liӋu huҩn luyӋn, và gom nhóm dӳ liӋu dӵa trên lý thuyӃt Pӡ. 1.5. .ӻ thuұt trӯҧnh HiӇu theo nghƭa hҽp, trӯ hai ҧnh có cùng kích thѭӟc là viӋc xây dӵng ҧnh Pӟi tӯ sӵ khác biӋt cӫa hai ҧnh. Theo nghƭa rӝng hѫn, trӯҧnh là viӋc tính toán ÿӝ chênh lӋch giӳa hai ҧnh trên mӝt ÿһc trѭng ҧnh nào ÿó nhѭ cѭӡng ÿӝ, màu sҳc, texture (kӃt cҩu), shape (hình dáng), chuyӇn ÿӝng Có nhiӅu kӻ thuұt trӯҧnh khác nhau, nhѭng có thӇ chia thành 3 loҥi: - 'ӵa vào ÿLӇm ҧnh: So sánh các cһp ÿLӇm ҧnh tѭѫng ӭng trên hai ҧnh. Nguy͍n QuǤnh Nga – CT701 Trang 13
  15. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p - 'ӵa vào khӕi: Chia ҧnh thành các miӅn và so sánh các miӅn tѭѫng ӭng. - 'ӵa vào biӇu ÿӗ: So sánh sӵ phân bӕ cӫa thuӝc tính nào ÿó cӫa ҧnh. .Ӄt hӧp các loҥi này vӟi các thuӝc tính so sánh cӫa ҧnh, ta sӁ có nhiӅu Nӻ thuұt trӯҧnh khác nhau. 1.5.1. 'ӵa vào so sánh ÿLӇm ҧnh Ĉây là phѭѫng pháp ÿӇ tính toán sӵ sai khác giӳa hai frame bҵng viӋc tính toán các giá trӏ, nó mô tҧ mӑi thay ÿәi vӅ cѭӡng ÿӝÿLӇm ҧnh trong các ҧnh. Có nhiӅu phѭѫng pháp ÿӇ tính sӵ sai khác này, Nagasaka và Tanaka ÿã ÿѭa ra mӝt phѭѫng pháp tính tәng toàn bӝ nhӳng thay ÿәi khác nhau vӅ Fѭӡng ÿӝÿLӇm ҧnh giӳa hai khung hình nhѭ là ÿӝ chênh lӋch khung D(f1, f2). 1 X -1 Y -1 D( f1 , f 2 ) = å å f1 (x, y) - f 2 (x, y) (1.2) X ´ Y x=0 y=0 Sau khi tính ÿѭӧc ÿӝ chênh lӋch D, tiӃn hành so sánh D vӟi ngѭӥng chuyӇn cҧnh T xác ÿӏnh xem có chuyӇn cҧnh hay không. Nhѭӧc ÿLӇm cӫa phѭѫng pháp này là: - Không thӇ phân biӋt ÿѭӧc thay ÿәi lӟn cho vùng ҧnh nhӓ và thay ÿәi nhӓ cho vùng ҧnh lӟn. Ví dө nhѭ các cҳt cҧnh rҩt dӉ bӏ bӓ sót khi mӝt phҫn nhӓ cӫa khung hình có sӵ thay ÿәi lӟn hoһc nhanh. - Nhҥy vӟi nhiӉu và các di chuyӇn cӫa camera. 0ӝt bѭӟc phát triӇn hѫn ÿѭӧc Otsuji ÿӅ xuҩt ÿó là thay vì tính toán trӵc tiӃp tәng nhӳng ÿLӇm khác biӋt lӟn vӅ cѭӡng ÿӝ thӵc tӃ, tiӃn hành ÿӃm các sӕ ÿLӇm ҧnh có thay ÿәi lӟn hѫn mӝt ngѭӥng nào ÿó, so sánh tәng ÿó vӟi ngѭӥng khác ÿӇ phát hiӋn chuyӇn cҧnh. Nguy͍n QuǤnh Nga – CT701 Trang 14
  16. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p ì1 , NӃu f 1 ()x , y - f 2 ()x , y > T1 DP()x, y = í (1.3) î0 , ngѭӧc lҥi 1 X -1 Y -1 D ( f1 , f 2 ) = å å DP ()x, y (1.4) X ´ Y x=0 y=0 1Ӄu tӹ lӋ sӕ ÿLӇm ҧnh thay ÿәi D(f1, f2) lӟn hѫn ngѭӥng T2 thì ÿã có chuyӇn cҧnh do cҳt. Tuy các thay ÿәi không liên quan trong khung hình ÿã ÿѭӧc loҥi bӟt nhѭng phѭѫng pháp này vүn nhҥy cҧm vӟi nhӳng di chuyӇn camera và di chuyӇn cӫa ÿӕi tѭӧng khi camera quay hѭӟng theo ÿӕi tѭӧng, rҩt nhiӅu ÿLӇm ҧnh thay ÿәi dù chӍ mӝt sӕ ít ÿLӇm ҧnh dӏch chuyӇn. Hình 1.12: Ҧnh hѭӣng cӫa chӟp sáng 0ӝt nhѭӧc ÿLӇm nӳa cӫa phѭѫng pháp phân biӋt ÿLӇm ҧnh là tính nhҥy Fҧm nhӳng thay ÿәi vӅÿӝ sáng cӫa ҧnh, ví dөÿLӇn hình là các chӟp sáng (ÿèn flash). Trên hình 1.12, giá trӏÿӝ xám nhҧy lên mӭc cao khi chӟp sáng xuҩt hiӋn. ĈLӅu này sӁ trӣ lҥi bình thѭӡng sau mӝt sӕ frame do các thay ÿәi mӣ cӫa camera. Nhѭng vӟi mӝt cҧnh thұt, phân bӕ màu sӁ không trӣ lҥi mӭc ban ÿҫu. Ngѭӡi ta dùng tӍ lӋ khác biӋt màu qua frame và khác biӋt màu long tern ÿӇ phát hiӋn flash. TӍ lӋ này ÿѭӧc ÿӏnh nghƭa: Fr(i) = D(i,i -1)/ D(i +d,i -1) (1.5) Nguy͍n QuǤnh Nga – CT701 Trang 15
  17. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Trong ÿó i là frame ÿang xét, và d là chiӅu dài trung bình cӫa thay ÿәi Pӣ cӫa camera. NӃu Fr(i) nhӓ hѫn mӝt ngѭӥng cho trѭӟc thì mӝt chӟp sáng ÿѭӧc phát hiӋn tҥi vӏ trí frame thӭ i và ngѭӧc lҥi. Khi ÿó ngѭӡi ta ÿLӅu chӍnh ÿӝ sai khác giá trӏÿLӇm ҧnh bҵng cách chia nó cho cѭӡng ÿӝ cӫa ÿLӇm ҧnh trên khung hình thӭ hai. X -1 Y -1 1 f1 (x, y) - f 2 (x, y) D( f1 , f 2 ) = å å (1.6) X ´ Y x=0 y=0 f 2 (x, y) Phѭѫng pháp trӯ giá trӏÿLӇm ҧnh cѫ bҧn là tính toán tӯ các giá trӏ cѭӡng ÿӝ, nhѭng có thӇ mӣ rӝng vӟi các ҧnh màu. Ví dө vӟi ҧnh màu RGB, ta tính Wәng có trӑng sӕ các sai khác cӫa ba giá trӏ Red, Green và Blue cӫa các ÿLӇm ҧnh. X Y D()f1 , f 2 = åå å w i f1i ()x , y - f 2 i ()x , y (1.7) x ==00y iÎ {}R ,G , B 1.5.2. 'ӵa vào khӕi Trái ngѭӧc vӟi hѭӟng tiӃp cұn sӱ dөng các ÿһc tính toàn cөc cӫa cҧ khung hình, hѭӟng tiӃp cұn phân khӕi sӱ dөng các ÿһc tính cөc bӝ nhҵm tăng tính ÿӝc lұp vӟi các di chuyӇn cӫa camera và ÿӕi tѭӧng. Mӛi khung hình ÿѭӧc chia thành b khӕi. Các khӕi trên khung hình f1 ÿѭӧc so sánh vӟi khӕi Wѭѫng ӭng trên khung hình f2. VӅ cѫ bҧn, ÿӝ chênh lӋch giӳa hai khung hình ÿѭӧc tính nhѭ sau: b D( f1, f2 ) =åCk .DP( f1, f2 ,k) (1.8) k -1 Trong ÿó Ck là hӋ sӕ cho trѭӟc, DP(f1,f2,k) là ÿӝ chênh lӋch giӳa khӕi thӭ k cӫa hai khung hình f1 và f2. Nguy͍n QuǤnh Nga – CT701 Trang 16
  18. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Kasturi so sánh các khӕi tѭѫng ӭng áp dөng công thӭc: 2 2 és + s æ m - m ö ù ê 1k 2 k + ç 1k 2 k ÷ ú ê 2 è 2 ø ú l = ë û k (1.9) s 1k .s 2 k Trong ÿó m1k , m 2k là giá trӏ cѭӡng ÿӝ trung bình cӫa khӕi thӭ k, và s1k ,s 2k là ÿӝ chênh lӋch tѭѫng ӭng vӟi hai khӕi ÿó. ì, 1NӃu NӃu lk ñ T1 DP()f1 , f 2 ,k = í 0 (1.10) î, ngѭ NӃu ngѭӧc lҥi 0ӝt cҳt cҧnh xҧy ra khi sӕ các khӕi thay ÿәi ÿӫ lӟn, nghƭa là D(f1,f2) > T2 và Ck =1 cho tҩt cҧ các khӕi. Phѭѫng pháp này chұm ÿi theo ÿӝ phӭc tҥp cӫa hàm thӕng kê. Phѭѫng pháp này có mӝt bҩt lӧi là các chuyӇn shot sӁ bӏ bӓ qua trong trѭӡng hӧp hai khӕi rҩt khác nhau có thӇ có cùng hàm Pұt ÿӝ. Tuy nhiên trѭӡng hӧp ÿó cNJng ít xҧy ra. 0ӝt hѭӟng tiӃp cұn khác vӟi kӻ thuұt trӯҧnh phân khӕi do Shahraray ÿѭa ra. Shahraray ÿã chia khung hình thành 12 miӅn và tìm miӅn thích hӧp nhҩt cho mӛi miӅn ӣ khung hình kia. Ĉӝ chênh lӋch tính bҵng kӻ thuұt trӯҧnh Gӵa vào ÿLӇm ҧnh cӫa tӯng miӅn ÿѭӧc sҳp xӃp. Tәng có trӑng sӕ cӫa các chênh lӋch ÿã sҳp xӃp cho ta kӃt quҧ D cuӕi cùng. Xiong phát triӇn phѭѫng pháp trӯ ҧnh, gӑi là so sánh th͹c, phát hiӋn chuyӇn cҧnh do ngҳt chӍ bҵng viӋc so sánh mӝt phҫn cӫa ҧnh. Phѭѫng pháp này chӍ ra rҵng, sai sót mҳc phҧi hoàn toàn có thӇ bӓ qua nӃu ít hѫn mӝt nӱa Vӕ các cӱa sә cѫ sӣ (các ô vuông không chӗng nhau, hình 1.13) ÿӅu ÿѭӧc kiӇm tra. Trong trѭӡng giӳa hai khung hình có sӵ biӃn ÿәi lӟn thì kích thѭӟc các cӱa sәÿѭӧc chӑn ÿӫ lӟn ÿӇ bҩt biӃn vӟi các thay ÿәi không làm vӥ và ÿӫ Nguy͍n QuǤnh Nga – CT701 Trang 17
  19. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p nhӓÿӇ có thӇ chӭa thông tin vӅ không gian nhiӅu chӯng nào có thӇ. Các cӱa Vә cѫ sӣÿѭӧc so sánh và tính ÿӝ chênh lӋch mӭc xám hoһc giá trӏ màu cӫa các ÿLӇm ҧnh. Khi giá trӏ chênh lӋch lӟn mӝt ngѭӥng nào ÿó thì xem nhѭ miӅn ÿang xét ÿã thay ÿәi. Khi sӕ miӅn thay ÿәi lӟn hѫn mӝt ngѭӥng khác thì Vӵ chuyӇn cҧnh do ngҳt ÿã xҧy ra. Thӵc nghiӋm ÿã chӭng minh rҵng hѭӟng tiӃp cұn này cho tӕc ÿӝ nhanh hѫn phѭѫng pháp so sánh tӯng cһp ÿLӇm, thұm chí cҧ phѭѫng pháp biӇu ÿӗ xét dѭӟi ÿây. Hình 1.13: Các cӱa sә cѫ sӣ trong thuұt toán so sánh thӵc 1.5.3. 'ӵa vào so sánh biӇu ÿӗ Phѭѫng pháp ÿo sӵ khác biӋt giӳa các frame dѭӟi dҥng giá trӏ màu không mҥnh do chuyӇn ÿӝng cӫa camera và ÿӕi tѭӧng có thӇ gây ra sӵ khác biӃt giá trӏÿLӇm ҧnh quá lӟn. Có thӇ dùng biӇu ÿӗ màu hoһc biӇu ÿӗ mӭc xám ÿӇ tính toán sӵ sai khác giӳa hai khung hình vì sӵ phân bӕ màu giӳa các frame liên tөc không bӏ ҧnh hѭӣng nhiӅu bӣi chuyӇn ÿӝng cӫa camera và chuyӇn ÿӝng cӫa ÿӕi tѭӧng. BiӇu ÿӗ màu (mӭc xám) cӫa khung hình i là mӝt vectѫ G chiӅu Hi = (Hi(1), Hi(2), , Hi(G)). Trong ÿó G là sӕ màu (mӭc xám), Hi(j) là sӕ ÿLӇm ҧnh cӫa khung hình i có màu (mӭc xám ) j. a) BiӇu ÿӗ toàn cөc Phѭѫng pháp ÿѫn giҧn nhҩt là tính tәng sӵ sai khác các cӝt cӫa biӇu ÿӗ. Nguy͍n QuǤnh Nga – CT701 Trang 18
  20. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p G D( f1, f2 ) = å H1(k) - H 2 (k) (1.11) k =0 Trong ÿó Hn là biӇu ÿӗ mӭc xám cӫa ҧnh thӭ n, k là giá trӏ hӧp lí cӫa Pӭc xám G. Có thӇ sӱ dөng thêm trӑng sӕ nӃu có mӝt sӕ màu (mӭc xám) ÿѭӧc xem xét quan trӑng hѫn vӟi mөc tiêu so sánh. G D( f1, f 2 ) = å w(k) H1 (k) - H 2 (k) (1.12) k =0 Trong ÿó w(k) là trӑng sӕӭng vӟi giá trӏ màu (mӭc xám ) k. Swain và Ballard lҥi sӱ dөng sӵ giao nhau cӫa biӇu ÿӗÿѭӧc so sánh: Hình 1.14: So sánh hai biӇu ÿӗ Vùng biӇu ÿӗ chung nhau, phҫn gҥch chéo trong hình 1, cho biӃt ÿӝ Wѭѫng tӵ vӅ nӝi dung hai ҧnh có thӇÿѭӧc ÿӏnh nghƭa nhѭ sau: G S( f1, f2 ) = åmin(H1(k) - H 2 (k)) (1.13) k =0 Nguy͍n QuǤnh Nga – CT701 Trang 19
  21. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Ĉӝ tѭѫng tӵ còn có thӇÿѭӧc ÿӏnh nghƭa nhѭ sau: G åmin(H1(k) - H 2 (k)) S( f , f ) = k =0 1 2 G (1.14) åmax(H1(k) - H 2 (k)) k =0 Nhѭ vұy có thӇ tính ÿӝ chênh lӋch biӇu ÿӗ hai khung hình theo công thӭc: G åmin(H1(k) - H 2 (k)) D( f , f ) = 1- S( f 1, f ) = 1- k =0 1 2 2 G (1.15) åmax(H1(k) - H 2 (k)) k -0 Phѭѫng pháp khác biӋt vӅ biӇu ÿӗ màu ÿѭӧc sӱ dөng nhiӅu và thông Gөng nhҩt vì nó tính toán nhanh, ÿѫn giҧn và hiӋu quҧ trong viӋc phát hiӋn chuyӇn cҧnh ÿӝt ngӝt, chuyӇn cҧnh rõ ràng, hoһc có sӵ dӏch chuyӇn nhӓ cӫa ÿӕi tѭӧng và sӵ dӏch chuyӇn nhӓ cӫa camera. Nhѭng vӟi chuyӇn cҧnh dҫn Gҫn, các ҧnh tӯ tӯ mӡÿi, ÿan xen lүn nhau, làm cho khác biӋt vӅÿһc trѭng giӳa các khung hình liên tiӃp tѭѫng ÿӕi nhӓ, không ÿӫÿӇ vѭӧt qua ngѭӥng xác ÿӏnh ÿã ÿһt ra, dүn ÿӃn khó phát hiӋn ÿѭӧc chuyӇn cҧnh. NӃu nhѭ ngѭӥng xác ÿӏnh thҩp quá thì sӁ tìm ra nhiӅu ÿRҥn dѭ thӯa, nӃu ÿһt ngѭӥng quá cao thì không phát hiӋn ÿѭӧc chuyӇn cҧnh. Mһt khác, trong trѭӡng hӧp camera hay ÿӕi tѭӧng chuyӇn ÿӝng nhanh cNJng tҥo ra sӵ khác biӋt tѭѫng ÿӕi lӟn giӳa các khung hình. ĈӇ giҧi quyӃt vҩn ÿӅ này, mӝt phѭѫng pháp ÿѭӧc ÿӅ xuҩt là Vӱ dөng hai ngѭӥng ÿӇ tăng mӭc ÿӝ tìm ÿúng và phát hiӋn ÿѭӧc chuyӇn cҧnh Gҫn dҫn, ÿó chính là phѭѫng pháp so sánh cһp. Phѭѫng pháp so sánh cһp tính toán chênh lӋch tích lNJy giӳa các khung hình sӱ dөng mӝt ngѭӥng lӟn hѫn cho chuyӇn cҧnh trӵc tiӃp Th và mӝt ngѭӥng nhӓ hѫn cho chuyӇn cҧnh dҫn dҫn Tl. Nguy͍n QuǤnh Nga – CT701 Trang 20
  22. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Trѭӟc tiên sӱ dөng ThÿӇ phát hiӋn chuyӇn cҧnh do cҳt cҧnh. Sau ÿó sӱ Gөng TlÿӇ phát hiӋn vӏ trí khung hình Fs có thӇ là khung hình ÿҫu tiên cӫa chuyӇn cҧnh dҫn dҫn, khung Fs này ÿѭӧc ÿem so sánh vӟi các khung tiӃp theo, công viӋc so sánh tích lNJy vì trong suӕt quá trình biӃn ÿәi dҫn dҫn ÿӝ chênh lӋch sӁ tăng lên. Khung hình cuӕi cùng cӫa chuyӇn cҧnh dҫn dҫn sӁ ÿѭӧc phát hiӋn khi ÿӝ chênh lӋch giҧm xuӕng thҩp hѫn mӭc ngѭӥng Tl, trong ÿó so sánh tích lNJy vѭӧt mӭc ngѭӥng Th. Hình 1.15: Phát hiӋn chuyӇn cҧnh dҫn dҫn bҵng phѭѫng pháp so sánh cһp 1Ӄu ÿӝ chênh lӋch giӳa các khung hình liên tiӃp giҧm xuӕng dѭӟi ngѭӥng Tl mà so sánh tích lNJy chѭa vѭӧt Th thì bӓ qua vӏ trí Fs và viӋc tìm kiӃm bҳt ÿҫu vӟi mӝt biӃn ÿәi dҫn dҫn khác. Tuy nhiên, có nhiӅu biӃn ÿәi dҫn Gҫn mà chêch lӋch giӳa các khung hình liên tiӃp ÿӅu nhӓ hѫn ngѭӥng bé Tl. 9ҩn ÿӅ này có thӇ giҧi quyӃt dӉ dàng bҵng cách ÿһt giá trӏ chҩp nhұn ÿѭӧc cho phép chӍ mӝt sӕ lѭӧng nhҩt ÿӏnh các khung hình liên tiӃp có chêch lӋch thҩp trѭӟc khi loҥi trѭӡng hӧp biӃn ÿәi ÿang xét. Nhѭ vұy, phѭѫng pháp so sánh cһp có thӇ phát hiӋn chuyӇn cҧnh ÿӝt ngӝt và chuyӇn cҧnh dҫn dҫn cùng Pӝt lúc. Qua kӃt quҧ thӵc nghiӋm cài ÿһt thuұt toán và so sánh các kӻ thuұt phân ÿRҥn khác nhau và thҩy rҵng so sánh cһp là phѭѫng pháp ÿѫn giҧn và phân ÿRҥn rҩt tӕt. Nguy͍n QuǤnh Nga – CT701 Trang 21
  23. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Nhѭӧc ÿLӇm cӫa phѭѫng pháp này là: - BiӇu ÿӗ chӍ mô tҧ sӵ phân bӕ các giá trӏ ÿLӇm ҧnh (màu hay mӭc xám) chӭ không chӭa ÿӵng các thông tin nào vӅ không gian. Nhѭ vұy hai ҧnh có cùng biӇu ÿӗ màu nhѭng vүn có thӇ có nӝi dung khác nhau do không gian phân bӕ khác nhau Hình 1.16: Các ҧnh có cùng biӇu ÿӗ màu nhѭng nӝi dung khác nhau - 9ӟi nhӳng vùng cҧnh nhӓ, khi thay ÿәi vүn gây ra chú ý nhѭng lҥi không ÿóng vai trò quan trӑng trong biӇu ÿӗ và nhѭ vұy thì rҩt dӉ bӏ bӓ qua khi tiӃn hành kƭ thuұt trӯҧnh ÿӇ tìm ra sӵ sai khác. b) BiӇu ÿӗ cөc bӝ BiӇu ÿӗ cөc bӝ là biӇu ÿӗ mô tҧ sӵ phân phӕi các giá trӏÿLӇm ҧnh trên Pӝt phҫn cӫa khung hình. Nhѭÿã ÿӅ cұp ӣ trên, phѭѫng pháp trӯҧnh dӵa vào biӇu ÿӗ là phѭѫng pháp ít chӏu ҧnh hѭӣng cӫa nhiӉu và sӵ di chuyӇn ÿӕi Wѭӧng. Tuy nhiên vӟi biӇu ÿӗ toàn cөc thì vүn gһp mӝt sӕ trӣ ngҥi, ÿӇ khҳc phөc nhӳng nhѭӧc ÿLӇm cӫa biӇu ÿӗ toàn cөc, chúng ta sӁ kӃt hӧp trӯҧnh dӵa vào biӇu ÿӗ vӟi kӻ thuұt trӯҧnh phân khӕi. Trӯҧnh phân khӕi quan tâm ÿӃn thông tin vӅ không gian. VӅ cѫ bҧn phѭѫng pháp này tӕt hѫn viӋc so sánh Wӯng cһp ÿLӇm ҧnh, nhѭng nó vүn chӏu tác ÿӝng cӫa sӵ di chuyӇn cӫa camera và ÿӕi tѭӧng và cNJng tӕn kém. Còn kӻ thuұt trӯҧnh dӵa vào biӇu ÿӗ không chӏu ҧnh hѭӣng nhiӅu cӫa camera hay sӵ di chuyӇn cӫa ÿӕi tѭӧng, nhѭng lҥi có nhѭӧc ÿLӇm là không chӭa ÿӵng thông tin vӅ không gian. Nhѭ vұy viӋc kӃt Kӧp hai phѭѫng pháp này sӁ bù ÿҳp ÿѭӧc nhӳng thiӃu sót cho nhau. Bҵng cách kӃt hӧp hai ý tѭӣng, chúng ta vӯa có thӇ giҧm ÿѭӧc tác ÿӝng cӫa sӵ di Nguy͍n QuǤnh Nga – CT701 Trang 22
  24. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p chuyӇn camera và ÿӕi tѭӧng, vӯa sӱ dөng thông tin vӅ không gian ҧnh, và cho NӃt quҧ phân ÿRҥn tӕt hѫn. Ý tѭӣng là, ta sӁ chia khung hình thành b khӕi, ÿánh sӕ tӯ 1 ÿӃn b. So sánh biӇu ÿӗ cӫa các khӕi tѭѫng ӭng rӗi tính tәng chênh lӋch ÿӇ có kӃt quҧ trӯҧnh cuӕi cùng. b D( f1 , f 2 ) = å DP( f1 , f 2 ,k) (1.16) k=1 Vӟi G DP( f1. f 2 ) = å H 1 ( j, k) - H 2 ( j, k) (1.17) j=0 Trong ÿó H(j,k) là giá trӏ biӇu ÿӗ tҥi mӭc xám j ӭng vӟi khӕi thӭ k. Hѭӟng tiӃp cұn khác trong kӻ thuұt trӯҧnh dӵa vào biӇu ÿӗ cөc bӝÿѭӧc Swanberg ÿѭa ra. Sӵ chênh lӋch DP(f1, f2, k) giӳa các khӕi ÿѭӧc tính bҵng cách so sánh biӇu ÿӗ màu RGB sӱ dөng công thӭc sau: G (H c ( j, k) - H c ( j,k))2 DP( f , f , k) = 1 2 1 2 åå c (1.18) cÎ={}R,0G,B j H 2 ( j, k) 1.5.4. 'ӵa vào phѭѫng pháp thӕng kê Phѭѫng pháp sai khác thӕng kê dӵa vào phѭѫng pháp trӯ giá trӏÿLӇm ҧnh, nhѭng thay vì tính tәng sӵ sai khác cӫa tҩt cҧ các ÿLӇm ҧnh, ta chia ҧnh thành các miӅn rӗi so sánh các ÿҥi lѭӧng thӕng kê ÿLӇm ҧnh cӫa các miӅn ÿó. Ta sӱ dөng thӕng kê tӹ lӋ sӕÿLӇm ҧnh thay ÿәi trên toàn bӝ khung hình, Vӱ dөng mӝt giá trӏ d là ngѭӥng sai khác ÿѭӧc tính giӳa hai ÿLӇm ҧnh tѭѫng ӭng. *ӑi S là tұp các ÿLӇm ҧnh có ÿӝ sai khác lӟn hѫn d: S = {(x,y) \ |f1(x,y) – f2(x,y)| > d} (1.19) Nguy͍n QuǤnh Nga – CT701 Trang 23
  25. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Ĉӝ sai khác giӳa hai khung hình ÿѭӧc tính bҵng tӹ lӋ các ÿLӇm ҧnh có ÿӝ chênh lӋch lӟn hѫn d. S.count D( f , f ) = 1 2 X *Y (1.20) Chúng ta có thӇ sӱ dөng cách khác là dùng các ÿҥi lѭӧng thӕng kê cho Wӯng miӅn, nhѭ biӇu ÿӗ chҷng hҥn. Phѭѫng pháp này có khá nhiӅu sai sót trong phát hiӋn cҧnh phim. Nguy͍n QuǤnh Nga – CT701 Trang 24
  26. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p CHѬѪNG 2: 0ӜT SӔ PHѬѪNG PHÁP PHÁT HIӊN CHUYӆN ĈӜNG 2.1. 7әng quan phѭѫng pháp trӯ nӅn 2.1.1. Giӟi thiӋu Nhұn dҥng ÿӕi tѭӧng chuyӇn ÿӝng tӯ chuӛi video là nӅn tҧng và tác vө quan trӑng trong giám sát video, kiӇm tra và phân tích giao thông, dò tìm và theo dõi con ngѭӡi, nhұn dҥng cӱ chӍ trong giao diӋn ngѭӡi máy. Phѭѫng pháp chung ÿӇ nhұn dҥng ÿӕi tѭӧng chuyӇn ÿӝng là trӯ nӅn, ӣÿây mӛi khung video ÿѭӧc so sánh vӟi mô hình tham chiӃu hoһc mô hình nӅn. Các pixel trong frame hiӋn thӡi mà lӋch ÿáng kӇ so vӟi nӅn sӁÿѭӧc xem nhѭ là ÿӕi Wѭӧng chuyӇn ÿӝng. Nhӳng pixel này ÿѭӧc xӱ lí tiӃp cho ÿӏnh vӏ và theo dõi ÿӕi tѭӧng. Trӯ nӅn là bѭӟc ÿҫu tiên và quan trӑng trong nhiӅu ӭng dөng thӏ giác máy, nó ÿѭӧc sӱ dөng ÿӇ trích trӑn ra nhӳng ÿLӇm tѭѫng ӭng ÿúng vӟi nhӳng ÿӕi tѭӧng chuyӇn ÿӝng quan tâm. Mһc dù nhiӅu giҧi thuұt trӯ nӅn ÿѭӧc ÿӅ xuҩt, nhѭng vҩn ÿӅ cӫa nhұn dҥng ÿӕi tѭӧng chuyӇn ÿӝng trong nhӳng môi trѭӡng phӭc tҥp vүn còn chѭa ÿѭӧc giҧi quyӃt hoàn toàn. Có mӝt vài vҩn ÿӅ mà mӝt giҧi thuұt trӯ nӅn tӕt phҧi giҧi quyӃt phù hӧp. Xét mӝt chuӛi video tӯ camera theo dõi cӕÿӏnh ӣ mӝt nút giao thông (tҥi nѫi giao nhau cӫa giao thông). Ĉây là mӝt môi trѭӡng ngoài trӡi, do ÿó mӝt giҧi thuұt trӯ nӅn phҧi thích nghi vӟi nhiӅu mӭc khác nhau cӫa ÿӝ sáng tҥi nhӳng thӡi ÿLӇm khác nhau trong ngày và xӱ lí ÿLӅu kiӋn thӡi tiӃt bҩt lӧi nhѭ sѭѫng mù hoһc tuyӃt làm thay ÿәi nӅn. ViӋc thay ÿәi bóng, ÿә bóng bӣi sӵ di chuyӇn cӫa ÿӕi tѭӧng, cҫn phҧi ÿѭӧc loҥi bӓÿӇ nhӳng ÿһc trѭng thích hӧp có thӇÿѭӧc trích chӑn tӯ nhӳng ÿӕi tѭӧng trong quá trình xӱ lí tiӃp theo. Luӗng giao thông phӭc tҥp tҥi chӛ giao nhau luôn ÿһt ra nhӳng thách thӭc mӟi cho giҧi thuұt trӯ nӅn. Xe di chuyӇn tӕc ÿӝ bình thѭӡng khi ÿèn xanh, nhѭng dӯng Oҥi khi ÿèn bұt ÿӓ. Xe cӝÿӭng yên không chuyӇn ÿӝng cho ÿӃn khi ÿèn xanh Eұt lҥi. Mӝt giҧi thuұt trӯ nӅn tӕt phҧi xӱ lý nhӳng ÿӕi tѭӧng chuyӇn ÿӝng mà Nguy͍n QuǤnh Nga – CT701 Trang 25
  27. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p ban ÿҫu nó hòa trӝn vӟi nӅn và sau ÿó nó không phҧi là nӅn. Ngoài ra, nhiӅu ӭng dөng cҫn phҧi xӱ lý thӡi gian thӵc, nên giҧi thuұt trӯ nӅn phҧi tính toán nhanh và có yêu cҫu bӝ nhӟ ít, trong khi vүn có khҧ năng xác ÿӏnh nhӳng ÿӕi Wѭӧng chính xác trong video. Trong phҫn này sӁ tұp trung giӟi thiӋu vҩn ÿӅ cӫa trӯ nӅn và tәng hӧp lҥi các phѭѫng pháp hiӋn tҥi, trên cѫ sӣÿó ÿѭa ra sӵ so sánh giӳa chúng dӵa vào 4 bѭӟc chӭc năng khác nhau: TiӅn xӱ lí, mô hình hóa nӅn, phát hiӋn ÿӕi Wѭӧng và hӧp lӋ hóa dӳ liӋu. 2.1.2. Giҧi thuұt trӯ nӅn. 0һc dù tӗn tҥi vô sӕ các giҧi thuұt trӯ nӅn trong các tài liӋu, nhѭng hҫu KӃt chúng ÿӅu theo mӝt lѭu ÿӗÿѫn giҧn nhѭ trong hình 2.1. Bӕn bѭӟc chính trong giҧi thuұt trӯ nӅn là: TiӅn xӱ lý, mô hình hóa nӅn, phát hiӋn ÿӕi tѭӧng và hӧp lӋ hóa dӳ liӋu. TiӅn xӱ lí bao gӗm nhӳng tác vө xӱ lí ҧnh ÿѫn giҧn cho video ÿҫu vào tҥo ÿLӅu kiӋn cho xӱ lí trong nhӳng bѭӟc tiӃp theo. Mô hình hóa nӅn sӱ dөng nhӳng frame video mӟi ÿӇ tính toán và cұp nhұt mӝt mô hình nӅn. Mô hình nӅn này cung cҩp phҫn mô tҧ thӕng kê cӫa toàn bӝ cҧnh QӅn. Dò tìm ÿӕi tѭӧng là xác ÿӏnh nhӳng pixel trong frame video không tѭѫng ӭng vӟi mô hình nӅn, và ÿѭa ra mһt nҥ nhӏ phân tѭѫng ӭng vӟi các ÿӕi tѭӧng. Cuӕi cùng, hӧp lӋ dӳ liӋu khҧo sát mһt nҥ thích hӧp này, loҥi bӓ nhӳng pixel không tѭѫng ӭng vӟi nhӳng ÿӕi tѭӧng chuyӇn ÿӝng thұt, và ÿѭa ra mһt nҥ cuӕi cùng. Delay Video Preprocessing Background Foreground Data Foreground Frames Modeling Detection Validation Masks Background Subtraction Hình 2.1: BiӇu ÿӗ luӗng chung cӫa các giҧi thuұt trӯ nӅn Nguy͍n QuǤnh Nga – CT701 Trang 26
  28. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 2.1.2.1. TiӅn xӱ lí Trong ÿa sӕ hӋ thӕng thӏ giác máy tính, nhӳng bӝ lӑc ÿѫn giҧn thѭӡng ÿѭӧc sӱ dөng trong trong gian ÿRҥn ÿҫu cӫa xӱ lý ÿӇ giҧm bӟt nhiӉu camera. Nhӳng bӝ lӑc có thӇÿѭӧc sӱ dөng ÿӇ loҥi bӓ nhӳng nhiӉu môi trѭӡng nhҩt thӡi nhѭ mѭa và tuyӃt Vӟi hӋ thӕng thӡi gian thӵc, giҧm bӟt kích thѭӟc frame và tӕc ÿӝ frame thѭӡng ÿѭӧc dùng ÿӇ làm giҧm tӕc ÿӝ xӱ lý dӳ liӋu. 1Ӄu camera chuyӇn ÿӝng hoһc nhiӅu camera ÿѭӧc sӱ dөng tҥi các vӏ trí khác nhau, ÿăng kí ҧnh giӳa các frame liên tөc và nhӳng camera khác nhau là cҫn thiӃt trѭӟc khi mô hình hóa nӅn. Mӝt vҩn ÿӅ khác trong tiӅn xӱ lý là ÿӏnh Gҥng dӳ liӋu ÿѭӧc sӱ dөng bӣi các giҧi thuұt trӯ nӅn khác nhau. Hҫu hӃt các giҧi thuұt ÿӅu xӱ lý cѭӡng ÿӝ chiӃu sáng. Mһc dù vұy, ҧnh màu, trong không gian màu RGB hoһc HSV, cNJng ÿѭӧc sӱ dөng khá phә biӃn trong trӯ nӅn [6,7]. Ngѭӡi ta cNJng ÿã chӍ ra rҵng khi xác ÿӏnh ÿӕi tѭӧng trong vùng ÿӝ Wѭѫng phҧn thҩp và khӱ bóng sinh ra do ÿӕi tѭӧng di chuyӇn thì sӱ dөng màu Vҳc tӕt hѫn sӱ dөng ÿӝ sáng. Ngoài ra, nhӳng ÿһc trѭng ҧnh dӵa trên pixel FNJng thѭӡng ÿѭӧc sӱ dөng ÿӇ kӃt hӧp các biên và thông tin chuyӇn ÿӝng. Ví dө, các giá trӏ cѭӡng ÿӝ và dүn xuҩt không gian có thӇ kӃt hӧp ÿӇ hình thành mӝt không gian trҥng thái ÿѫn cho kiӇm tra nӅn vӟi bӝ lӑc Kalman. Trѭӡng hӧp khác kӃt hӧp cҧ dүn xuҩt không gian và thӡi gian ÿӇ tҥo thành mô hình nӅn vұn tӕc ÿӅu cho phát hiӋn tӕc ÿӝ xe. Mһt hҥn chӃ chính cӫa phѭѫng pháp này là làm tăng sӵ phӭc tҥp cho ѭӟc lѭӧng tham sӕ mүu. Ĉӝ phӭc tҥp thѭӡng tăng ÿáng kӇ khi ÿa sӕ các kӻ thuұt mô hình hóa nӅn sӱ dөng mүu ÿӝc lұp cho mӛi pixel. 2.1.2.2. Mô hình hóa nӅn Mô hình hóa nӅn là vҩn ÿӅ trӑng tâm cӫa bҩt kǤ giҧi thuұt trӯ nӅn nào. NhiӅu nghiên cӭu ÿã tұp trung ÿӇ phát triӇn mô hình hóa nӅn linh hoҥt chӕng Oҥi sӵ thay ÿәi cӫa môi trѭӡng, nhѭng ÿӫ nhҥy ÿӇ xác ÿӏnh mӑi chuyӇn ÿӝng Nguy͍n QuǤnh Nga – CT701 Trang 27
  29. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Fҫn quan tâm. Các kƭ thuұt mô hình hóa nӅn ÿѭӧc phân thành 2 loҥi - không ÿӋ quy và ÿӋ quy. a) .ӻ thuұt không ÿӋ quy .ӻ thuұt không ÿӋ quy sӱ dөng phѭѫng pháp cӱa sә trѭӧt ÿӇѭӟc lѭӧng QӅn. Nó lѭu trӳ mӝt bӝÿӋm cho L frame video trѭӟc và ѭӟc lѭӧng ҧnh nӅn Gӵa vào sӵ biӃn thiên thӡi gian cӫa mӛi pixel trong bӝÿӋm. Kӻ thuұt không ÿӋ quy có khҧ năng thích ӭng cao nhѭ là chúng không phө thuӝc vào thӡi ÿLӇm nhӳng frame lѭu trӳ trong bӝÿӋm. Mһt khác, yêu cҫu vùng lѭu trӳ có thӇ lӟn nӃu bӝÿӋm lӟn cҫn thiӃt ÿӇÿӕi phó vӟi nhӳng chuyӇn ÿӝng chұm cӫa giao thông. Cho mӝt bӝÿӋm vӟi kích thѭӟc cӕÿӏnh, vҩn ÿӅ này có thӇ giҧm Eӟt tӯng phҫn bҵng viӋc lѭu trӳ các frame video tҥi mӝt tӕc ÿӝ frame chұm r. 'ѭӟi ÿây là mӝt sӕ kӻ thuұt không ÿӋ quy thѭӡng ÿѭӧc sӱ dөng: Ø 6ӵ khác biӋt khung Ĉây là kӻ thuұt mô hình hoá nӅn ÿѭӧc coi là ÿѫn giҧn nhҩt, nó sӱ dөng frame video tҥi thӡi ÿLӇm t -1 làm mô hình nӅn cho khung tҥi thӡi ÿLӇm t. Khi nó chӍ sӱ dөng frame ÿѫn phía trѭӟc thì sӵ phân biӋt khung có thӇ sӁ không xác ÿӏnh ÿѭӧc nhӳng pixel bên trong mӝt phҥm vi lӟn mà ÿӕi tѭӧng chuyӇn ÿӝng có màu ÿӗng dҥng. Ĉây chính là mӝt vҩn ÿӅ hҥn chӃ. Ø /ӑc trung bình /ӑc trung bình là mӝt trong nhӳng kӻ thuұt mô hình hoá nӅn hay ÿѭӧc Vӱ dөng nhҩt. Ѭӟc lѭӧng nӅn ÿѭӧc ÿӏnh nghƭa là trung bình tҥi mӛi vӏ trí pixel Fӫa tҩt cҧ các frame trong bӝÿӋm. Ĉӝ phӭc tҥp cӫa tính toán sӕ trung bình là O(L log L) cho mӛi pixel. Ø %ӝ lӑc ѭӟc ÿoán tuyӃn tính Toyama tính ѭӟc lѭӧng nӅn hiӋn thӡi bҵng cách áp dөng bӝ lӑc ѭӟc ÿoán tuyӃn tính trên các pixel trong bӝÿӋm. HӋ sӕ lӑc ÿѭӧc ѭӟc lѭӧng tҥi mӛi thӡi Nguy͍n QuǤnh Nga – CT701 Trang 28
  30. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p ÿLӇm cӫa khung dӵa vào hiӋp phѭѫng sai mүu, do ÿó kӻ thuұt này khó áp Gөng trong xӱ lý thӡi gian thӵc. Ø Mô hình không có tham sӕ Khác vӟi các kӻ thuұt trѭӟc sӱ dөng ѭӟc lѭӧng nӅn ÿѫn cho mӛi vӏ trí pixel, Elgammal ÿã sӱ dөng toàn bӝ I t-L , I t-L+1 , , I t-1 ÿӇ tҥo mӝt ѭӟc lѭӧng không có tham sӕ cӫa hàm mұt ÿӝ pixel f(It = u): 1 t-1 f (I t = u) = å K(u - I i ) (2.1) L i=t-L K(.) là hàm ѭӟc lѭӧng, pixel hiӋn thӡi Itÿѭӧc coi nhѭ không phҧi nӅn QӃu nó không giӕng nhѭ sӵ phân bӕ này, nghƭa là f(It) nhӓ hѫn so vӟi ngѭӥng giӟi hҥn. Ѭu ÿLӇm cӫa viӋc sӱ dөng hàm mұt ÿӝÿҫy ÿӫ cho ѭӟc lѭӧng ÿѫn là khҧ năng quҧn lý phân bӕ nӅn phӭc tҥp. Nhӳng ví dө cӫa nӅn phӭc tҥp bao Jӗm các ÿLӇm tӯ cây ÿung ÿѭa hoһc các biên có ÿӝ tѭѫng phҧn cao mà chúng Eӏ nhòe do sӵ chuyӇn ÿӝng cӫa camera. b) Các kӻ thuұt ÿӋ quy .ӻ thuұt ÿӋ quy không thӇ duy trì bӝÿӋm cho viӋc ѭӟc lѭӧng nӅn. Thay vào ÿó, ngѭӡi ta sӱ dөng mӝt phѭѫng pháp ÿӋ quy mӟi, ÿó là cұp nhұt các mô hình nӅn ÿѫn dӵa vào các frame ÿҫu vào. So vӟi các phѭѫng pháp không có ÿӋ quy thì phѭѫng pháp sӱ dөng ÿӋ quy cҫn bӝ lѭu trӳ ít hѫn rҩt nhiӅu, tuy Yұy mӝt sӕ lӛi trong mô hình nӅn vүn còn tӗn tҥi trong bҩt kǤ thӡi ÿLӇm nào. Ø /ӑc trung bình xҩp xӍ ĈӇ có ÿѭӧc sӵ thành công cӫa lӑc trung bình không ÿӋ quy, McFarlane và Schofield ÿӅ xuҩt mӝt phѭѫng pháp lӑc ÿӋ quy ÿѫn giҧn. Phѭѫng pháp này ÿã ÿѭӧc sӱ dөng trong mô hình mô hình hoá nӅn ÿӇ theo dõi giao thông ÿô thӏ. Trong mô hình này, giá trӏ trung bình sӁÿѭӧc tăng mӝt ÿѫn vӏ nӃu ÿLӇm ҧnh ÿҫu vào lӟn hѫn ѭӟc lѭӧng ban ÿҫu, và giҧm ÿi mӝt ÿѫn vӏ nӃu các Nguy͍n QuǤnh Nga – CT701 Trang 29
  31. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p ÿLӇm ҧnh này nhӓ hѫn. Giá trӏ này sӁ dҫn hӝi tө tҥi mӝt ngѭӥng gӑi là trung ÿLӇm ÿѭӧc ngăn cách bӣi mӝt bên là nhӳng ÿLӇm ҧnh có giá trӏ lӟn, và mӝt bên là nhӳng ÿLӇm ҧnh có giá trӏ nhӓ. Ø /ӑc Kalman Ĉây là bӝ lӑc phә biӃn sӱ dөng kӻ thuұt ÿӋ quy cho nhӳng hӋ thӕng theo dõi chuyӇn ÿӝng dѭӟi nhiӉu Gaussian. Có rҩt nhiӅu phiên bҧn ÿã ÿѭӧc ÿӅ xuҩt cho mô hình hoá nӅn, sӵ khác biӋt chính trong không gian trҥng thái ÿѭӧc sӱ dөng cho viӋc theo dõi. Phiên bҧn ÿѫn giҧn nhҩt chӍ sӱ sөng cѭӡng ÿӝ chiӃu sáng. Karmann và Brandt sӱ dөng cҧ cѭӡng ÿӝ và trҥng thái thӡi gian, trong khi Koller, Weber và Mailk lҥi sӱ dөng cѭӡng ÿӝ và trҥng thái không gian. Phѭѫng trình sau mô tҧ trҥng thái cӫa hӋ thӕng, vӟi Bt là cѭӡng ÿӝ, và Bt’ là trҥng thái thӡi gian: éBt ù éBt -1 ù éBt -1 ù ê ú = A × ê ú + K t × (I t - H × A × ê ú) (2.2) ëBt¢û ëBt¢-1 û ëBt¢-1 û Ma trұn A mô tҧ các nӅn ÿӝng, và H là phép ÿo ma trұn: é1 0.7ù A = ê ú , H =[]1 0 (2.3) ë0 0.7û Kalman ÿã khuӃch ÿҥi ma trұn Kt tҥo nhӳng biӃn ÿәi nҵm giӳa hai mӭc: thích nghi chұm a1 và thích nghi nhanh a2. éa 1 ù éa 2 ù K t = ê ú nӃu It-1 là ÿӕi tѭӧng, và ê ú ngѭӧc lҥi (2.4) ëa 1 û ëa 2 û Ø Mixture of Gaussians(MoG) Không giӕng nhѭ bӝ lӑc Kalman là chӍ theo dõi sӵ biӃn ÿәi cӫa mӝt hàm Gaussian, phѭѫng pháp MoG ÿӗng thӡi theo dõi sӵ biӃn ÿәi cӫa nhiӅu hàm Gaussian. Tѭѫng tӵ nhѭ mô hình không có tham sӕÿѭӧc trình bày trong mөc a), MoG duy trì mӝt hàm mұt ÿӝ cho mӛi ÿLӇm ҧnh. Nhѭ vұy, nó có khҧ năng Nguy͍n QuǤnh Nga – CT701 Trang 30
  32. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p [ӱ lý tӕt trên nhӳng mô hình có nӅn phӭc tҥp. Mһt khác, MoG là mӝt tham Vӕ, nhӳng mô hình tham sӕ có khҧ năng thích nghi và cұp nhұt nhѭng lҥi không thӇ lѭu trӳ nhӳng vùng ÿӋm lӟn cӫa video. Hàm f(It = u) là sӵ pha trӝn Fӫa K Gaussian: K f (I t = u) = å w i,t ×h (u; m i,t ,s i,t ) (2.5) i=1 Ӣÿây h(u; mi,t ,s i,t ) là thành phҫn Gaussian thӭ i vӟi cѭӡng ÿӝ trung m bình i,t It - miÖ,t -1 £ D ×s iÖ,t-1 và ÿӝ lӋch chuҭn s i,t ,wi,t là phҫn dӳ liӋu ÿѭӧc tính cho thành phҫn thӭ i, phҥm vi cӫa K là tӯ 3 ÿӃn 5 phө thuӝc các giá trӏ Oѭu trӳ. Vӟi mӛi pixel ÿҫu vào It bѭӟc ÿҫu tiên là xác ÿӏnh thành phҫn iÖ. Thành phҫn iÖ ÿѭӧc mô tҧ nhѭ là thành phҫn ÿѭӧc ÿӕi sánh nӃu It - miÖ,t -1 £ D ×s iÖ,t -1 Ӣÿây D là ngѭӥng vӟi giá trӏ xác ÿӏnh. Nhӳng tham sӕ cӫa các thành phҫn ÿѭӧc ÿӕi sánh ÿѭӧc cұp nhұt lҥi nhѭ sau: w i,t = (1 - a )w iÖ,t -1 + a m iÖ,t = (1 - r )m iÖ,t -1 + rI t (2.6) 2 2 2 s iÖ,t = (1 - r )s iÖ,t -1 + r (I t - m iÖ,t ) Ӣÿây a là tӍ lӋ nҵm trong khoҧng 0 £a £ 1 do ngѭӡi sӱ dөng ÿӏnh nghƭa, r bҵng xҩp xӍ tӍ lӋ cӫa nhӳng tham sӕ: a r» (2.7) wiÖ,t Nguy͍n QuǤnh Nga – CT701 Trang 31
  33. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 1Ӄu không tìm thҩy thành phҫn tѭѫng ӭng, thành phҫn có trӑng sӕ nhӓ nhҩt sӁÿѭӧc thay thӃ bӣi mӝt thành phҫn mӟi vӟi giá trӏ trung bình It, ÿӝ biӃn thiên ban ÿҫu lӟn s 0 và trӑng sӕ nhӓ w0 . Phҫn còn lҥi có giá trӏ trung bình và ÿӝ biӃn thiên tѭѫng tӵ nhѭng trӑng Vӕ cӫa nó thҩp hѫn ÿѭӧc tính theo: w i,t = (1 - a )w i,t -1 (2.8) Cuӕi cùng tҩt cҧ các trӑng sӕÿӅu ÿѭӧc chuҭn hóa lҥi vӟi tәng là 1. ĈӇ xác ÿӏnh It là mӝt pixel ÿӕi tѭӧng trѭӟc tiên chúng ta phҧi xӃp hҥng tҩt cҧ các thành phҫn bӣi các giá trӏ w i, t / s i, t cӫa chúng. Thành phҫn có hҥng cao Kѫn sӁ có ÿӝ biӃn thiên thҩp và tӍ lӋ xác suҩt cao, ÿây chính là ÿһc trѭng cѫ Eҧn cӫa nӅn. NӃu i1,i2 , ,iK là thӭ tӵ các thành phҫn sau khi sҳp xӃp, thì M thành phҫn ÿҫu tiên thoҧ mãn các ÿLӅu kiӋn ÿѭӧc khai báo là nhӳng thành phҫn nӅn. i M w ³ G å k , t (2.9) k = i1 Ӣÿây G là trӑng sӕ ngѭӥng, It là nhӳng ÿLӇm khác nӅn. 2.1.2.3. Phát hiӋn ÿӕi tѭӧng Phát hiӋn ÿӕi tѭӧng là viӋc so sánh khung video hiӋn thӡi vӟi mô hình QӅn và xác ÿӏnh các pixel ÿӕi tѭӧng tӯ frame ÿҫu vào ÿó. Ngoҥi trӯ mô hình không có tham biӃn và mô hình MoG, còn lҥi tҩt cҧ các kӻ thuұt ÿѭӧc giӟi thiӋu ӣ mөc 2.1.2.2 ÿӅu sӱ dөng mӝt ҧnh ÿѫn làm mô hình nӅn cho chúng. Nhӳng phѭѫng pháp phә biӃn nhҩt ÿѭӧc sӱ dөng cho phát hiӋn ÿӕi tѭӧng là kiӇm tra sӵ khác biӋt cӫa các pixel ÿҫu so vӟi ѭӟc lѭӧng nӅn tѭѫng ӭng. I t (x, y) - Bt (x, y) > T (2.10) Nguy͍n QuǤnh Nga – CT701 Trang 32
  34. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 0ӝt cách khác hay ÿѭӧc sӱ dөng là phân ngѭӥng dӵa trên các tiêu chuҭn thӕng kê: I t ( x, y) - B t ( x, y) - m d > T s (2.11) s d Trong ÿó md và sd là giá trӏ trung bình và ÿӝ lӋch tiêu chuҭn cӫa It (x, y) – Bt (x, y) cho mӑi vӏ trí không gian (x, y). ViӋc xác ÿӏnh T và Ts là Gӵa vào thӵc nghiӋm. 0ӝt hѭӟng tiӃp cұn khác là sӱ dөng ÿӝ khác nhau tѭѫng ÿӕi hѫn là ÿӝ khác nhau tuyӋt ÿӕi ÿӇ nәi bұt ÿӝ tѭѫng phҧn trong nhӳng vùng tӕi nhѭ là ÿә bóng I t ( x, y ) - B t ( x, y ) > Tc (2.12) B t ( x, y ) Tuy nhiên, kƭ thuұt này không thӇ sӱ dөng ÿӇ tăng ÿӝ tѭѫng phҧn trong các ҧnh sáng nhѭ cҧnh ngoài trӡi dѭӟi sѭѫng mù dày ÿһc. Mӝt hѭӟng tiӃp cұn khác ÿӇÿѭa ra ÿӝ biӃn thiên không gian là sӱ dөng hai ngѭӥng vӟi hiӋn tѭӧng trӉ. Ý tѭӣng cѫ bҧn là ban ÿҫu xác ÿӏnh các pixel không thuӝc nӅn mà chúng khác biӋt tuyӋt ÿӕi vӟi các ѭӟc lѭӧng nӅn vѭӧt quá mӝt ngѭӥng. Sau ÿó vùng ÿӕi tѭӧng ÿѭӧc phát triӇn tӯ các pixel ÿã ÿѭӧc xác ÿӏnh, có thӇÿѭӧc thӵc hiӋn bӣi viӋc sӱ dөng giҧi thuұt kӃt nӕi các nhóm thành phҫn. 2.1.2.4. +ӧp lí hoá dӳ liӋu Chúng ta ÿӏnh nghƭa hӧp lí hoá dӳ liӋu là quá trình xӱ lí, cҧi tiӃn mһt nҥ xác ÿӏnh ÿӕi tѭӧng dӵa vào thông tin thu ÿѭӧc tӯ bên ngoài mô hình nӅn. Tҩt Fҧ các mô hình nӅn trong phҫn 2.1.2.2 có ba hҥn chӃ chính: thӭ nhҩt, chúng Eӓ qua tҩt cҧ các mӕi liên quan giӳa các pixel lân cұn; thӭ hai, tӕc ÿӝ thích nghi có thӇ không phù hӧp vӟi tӕc ÿӝ chuyӇn ÿӝng cӫa các ÿӕi tѭӧng; thӭ ba, nhӳng pixel ÿӝng do ÿung ÿѭa cӫa các lá cây, hoһc ÿә bóng do các ÿӕi tѭӧng chuyӇn ÿӝng dӉ gây hiӇu lҫm là ÿӕi tѭӧng thӵc sӵ. Vҩn ÿӅÿLӇn hình ÿҫu tiên Nguy͍n QuǤnh Nga – CT701 Trang 33
  35. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Gүn ÿӃn khҷng ÿӏnh sai hoһc phӫÿӏnh sai các vùng phân bә ngүu nhiên ngang qua mһt nҥӭng cӱ. Hѭӟng tiӃp cұn chung ÿӇ giҧi quyӃt vҩn ÿӅÿҫu tiên là kӃt Kӧp lӑc hình thái và nhóm thành phҫn liên kӃt ÿӇ loҥi bӓ nhӳng vùng ngүu nhiên do hҥn chӃ thӭ nhҩt sinh ra. Áp dөng bӝ lӑc hình thái trên các mһt nҥ ÿӕi tѭӧng loҥi bӓ nhӳng pixel ÿӕi tѭӧng ÿӭng riêng biӋt và hӧp nhҩt các vùng liӅn kӅ. Nhóm thành phҫn kӃt nӕi có thӇ sӱ dөng ÿӇ xác ÿӏnh tҩt cҧ các vùng ÿӕi tѭӧng, và loҥi bӓ nhӳng vùng quá nhӓÿӇ tѭѫng ӭng vӟi các ÿӕi tѭӧng chuyӇn ÿӝng thӵc. Mӝt hѭӟng tiӃp cұn ÿѫn giҧn ÿӇ làm giҧm bӟt các vҩn ÿӅ trên là sӱ dөng nhiӅu các mô hình nӅn chҥy tҥi các tӕc ÿӝ thích ӭng khác nhau, ngoài ra phân ÿRҥn màu có thӇÿѭӧc sӱ dөng ÿӇ phát triӇn các vùng ÿӕi Wѭӧng bҵng giҧ thuyӃt tәng hӧp các màu tѭѫng tӵ khҳp toàn bӝÿӕi tѭӧng 1Ӄu nhiӅu camera cùng thu ÿѭӧc nhӳng cҧnh tѭѫng tӵ tҥi các góc khác nhau, thông tin chênh lӋch giӳa các camera có thӇ sӱ dөng ÿӇѭӟc lѭӧng chiӅu sâu. Thông tin chiӅu sâu rҩt hӳu ích khi ÿӕi tѭӧng không phҧi là nӅn. Vҩn ÿӅ cuӕi cùng có thӇ giҧi quyӃt bӣi viӋc sӱ dөng nhӳng kƭ thuұt mô hình hoá nӅn phӭc Wҥp nhѭ MoG và áp dөng bӝ lӑc hình thái ÿӇ làm sҥch dӳ liӋu. Mһt khác, khӱ bóng chuyӇn ÿӝng là vҩn ÿӅ khó giҧi quyӃt, ÿһc biӋt vӟi video có ÿӝ chiӃu sáng cao. Nhӳng nghiên cӭu và so sánh cӫa các giҧi thuұt khӱ bóng ÿѭӧc trình bày trong [7]. a) b) c) d) Hình 2.2: Khung mүu và các nӅn tѭѫng ӭng tӯ bӕn cҧnh: a)Cҧnh sáng, b)Cҧnh có sѭѫng mù, c)Cҧnh có tuyӃt, d)Cҧnh có xe cӝÿông ÿúc. Nguy͍n QuǤnh Nga – CT701 Trang 34
  36. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 2.2. Trӯ nӅn sӱ dөng thông tin màu và gradiant 2.2.1. Giӟi thiӋu NhiӅu phѭѫng pháp ÿã ÿѭӧc phát triӇn ÿӇ phát hiӋn chuyӇn ÿӝng trong Pӝt chuӛi các ҧnh. Các giҧi thuұt này sӱ dөng trӯ nӅn liên quan ÿӃn nhӳng sӵ thay ÿәi màu hay ÿӝ chiӃu sáng. Nó ÿѭӧc thӵc hiӋn bҵng cách so sánh màu hoһc cѭӡng ÿӝ các pixel cӫa ҧnh ÿҫu vào vӟi ҧnh tham chiӃu, nӃu có sӵ khác nhau ÿáng kӇ so vӟi ҧnh tham chiӃu thì có nghƭa là có sӵ chuyӇn ÿӝng. Phѭѫng pháp này có thӇ cho kӃt quҧ sai lӋch khi mà có các ÿLӅu kiӋn không lí Wѭӣng. Mӝt phѭѫng pháp trӯ nӅn khác sӱ dөng thông tin màu và gradient ÿӇ nâng cao hiӋu quҧ phát hiӋn, ÿѭӧc ÿӅ xuҩt bӣi Jabri sau ÿó ÿѭӧc thay ÿәi bӣi Javed, Shafique và Shah. Hѭӟng tiӃp cұn này là xây dӵng mô hình nӅn sӱ Gөng thông tin màu và thông tin gradient, sau ÿó thӵc hiӋn trӯ nӅn dùng các mô hình ÿó. Mô hình này luôn ÿѭӧc cұp nhұt ÿӇ thích ӭng vӟi nhӳng thay ÿәi chұm trong chiӃu sáng. 2.2.2. Mô hình hóa nӅn Mô hình nӅn ÿѭӧc xây dӵng tӯ hai phҫn, mô hình màu và mô hình gradient. Mô hình màu ÿѭӧc xây dӵng cho mӛi mӝt kênh màu. Nó bao gӗm hai ҧnh ÿҥi diӋn cho giá trӏ trung bình và ÿӝ lӋch tiêu chuҭn cho thành phҫn màu ÿó. Mӛi pixel trong ҧnh trung bình ÿѭӧc tính toán sӱ dөng. ut = axt + ()1 - a ut -1 (2.13) Trong ÿó ut là trung bình ÿѭӧc tính trên frame t, Į là tӕc ÿӝ hӑc cӫa mô hình, và xt là cѭӡng ÿӝ thành phҫn màu trong frame t. Trӯҧnh ÿҫu vào vӟi ҧnh trung bình sӁ xác ÿӏnh nhӳng pixel bӏ thay ÿәi cѭӡng ÿӝ. Trong quá trình trӯ nӅn, ҧnh ÿӝ lӋch chuҭn ıtÿѭӧc sӱ dөng ÿӇ chuҭn hóa ҧnh tin cұy và nó ÿѭӧc tính nhѭ sau: 2 2 2 s t = a()()xt - ut + 1-a s t-1 (2.14) Nguy͍n QuǤnh Nga – CT701 Trang 35
  37. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Mô hình biên bao gӗm 2 ҧnh trung bình và 2 ҧnh ÿӝ lӋch chuҭn, ÿѭӧc tính bҵng cách áp dөng dò tìm biên sobel phѭѫng ngang và thҷng ÿӭng vӟi ҧnh mӭc xám. KӃt quҧ gradient phѭѫng ngang là H, gradient phѭѫng thҷng ÿӭng là V. Ҧnh trung bình ÿѭӧc tính nhѭ sau: H t = bH + (1- b )H t-1 (2.15) Vt = bV + (1- b )Vt-1 Trong ÿó ȕ là tӕc ÿӝ hӑc cӫa mô hình. Các ҧnh lӋch chuҭn ıH,t và ıV,t ÿѭӧc tính tѭѫng tӵ nhѭ mô hình màu. Mô hình biên ÿѭӧc dùng ÿӇ xác ÿӏnh nhӳng thay ÿәi trong cҩu trúc mӝt ҧnh. Các ҧnh ÿӝ lӋch tiêu chuҭn ÿѭӧc tính toán chӍ vӟi chuӛi các ҧnh nӅn Wƭnh trong khi nhӳng ҧnh trung bình ÿѭӧc cұp nhұt liên tөc. ĈLӅu này cho phép mô hình nӅn ÿѭӧc ÿLӅu chӍnh vӟi nhӳng thay ÿәi dҫn dҫn trong ÿӝ chiӃu sáng. 50 50 50 100 100 100 150 150 150 200 200 200 50 100 150 200 250 300 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.3: Ҧnh trung bình cho kênh màu ÿӓ, biên ngang, và biên thҷng ÿӭng tҥi frame thӭ 25. 2.2.3. Trӯ nӅn Trӯ nӅn ÿѭӧc thӵc hiӋn bҵng cách thӵc hiӋn trӯ dӵa vào màu và trӯ dӵa vào biên riêng biӋt sau ÿó kӃt hӧp các kӃt quҧ vӟi nhau. Hình 2.4 biӇu diӉn các ҧnh mà phép trӯ sӁÿѭӧc thӵc hiӋn Nguy͍n QuǤnh Nga – CT701 Trang 36
  38. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 50 50 100 100 150 150 200 200 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.4: Khung 65 và 70 tӯ chuӛi 96 khung. 2.2.3.1. Trӯ nӅn dӵa vào màu Phép trӯ dӵa vào màu ÿѭӧc thӵc hiӋn bҵng cách trӯҧnh hiӋn thӡi vӟi ҧnh trung bình trong mӛi mӝt kênh màu. KӃt quҧ cӫa phép trӯ này là ÿѭa ra 3 ҧnh khác nhau ÿѭӧc sӱ dөng ÿӇ tҥo nên 3 ҧnh tin cұy ÿѭӧc chuҭn hóa. ĈLӅu này ÿѭӧc thӵc hiӋn bҵng cách so sánh sӵ khác biӋt vӟi 2 ngѭӥng mcı và Mcı, ÿѭӧc lҩy tӯ các ҧnh ÿӝ lӋch chuҭn. Vӟi mӛi pixel, ÿӝ tin cұy ÿѭӧc tính toán nhѭ sau: ì0 D M cs Khi có mӝt sӵ thay ÿәi lӟn trong mӝt vài màu thì ÿó là miӅn có chӭa ÿӕi Wѭӧng. Mӛi mӝt ҧnh tin cұy CC có thӇÿѭӧc tҥo bҵng cách lҩy giá trӏ tin cұy Oӟn nhҩt cho mӛi pixel. Hình 2.5 biӇu diӉn nhӳng ҧnh tin cұy cho frame 65 và 70. 50 50 100 100 150 150 200 200 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.5: Phép trӯ màu cho khung 65 và 70. Nguy͍n QuǤnh Nga – CT701 Trang 37
  39. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 2.2.3.2. Trӯ nӅn dӵa vào biên Phép trӯ dӵa vào biên ÿѭӧc thӵc hiӋn bҵng cách lҩy các ҧnh phѭѫng ngang hiӋn thӡi trӯÿi ҧnh trung bình Ht và lҩy các ҧnh phѭѫng thҷng ÿӭng hiӋn thӡi trӯÿi ҧnh trung bình Vt: DH = H - H t , DV = V -Vt (2.17) Biên gradient cӫa ҧnh là: DG = DH + DV (2.18) Ҧnh tin cұy ÿѭӧc tính toán bҵng viӋc nhân ǻG vӟi mӝt hӋ sӕ nhân tin Fұy R và so sánh kӃt quҧ vӟi 2 ngѭӥng meı và Meı. Ӣÿây, ı là tәng ÿӝ lӋch chuҭn phѭѫng ngang và ÿӝ lӋch chuҭn phѭѫng thҷng ÿӭng. Vӟi mӛi pixel, ta giҧ sӱ: * G = H + V , Gt = H t + Vt , Gt = max{}G,Gt (2.19) Sau ÿó DG R = * (2.20) Gt Ĉӝ tin cұy cӫa mӛi pixel ÿѭӧc tính toán nhѭ sau: ì0 RDG M es Biên có thӇÿѭӧc phân loҥi tҥi ÿLӇm này. NӃu có mӝt sӵ khác nhau lӟn và có mӝt biên quan trӑng trong ҧnh hiӋn thӡi, thì biên xem xét ÿang ÿѭӧc khép kín. NӃu có mӝt sӵ khác nhau lӟn và không có mӝt biên quan trӑng trong ҧnh hiӋn thӡi, thì nó ÿã ÿѭӧc khép kín. Nguy͍n QuǤnh Nga – CT701 Trang 38
  40. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 50 50 100 100 150 150 200 200 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.6: Phép trӯ biên cho frame 65 và 70. 2.2.3.3. .Ӄt hӧp các kӃt quҧ trӯ màu và trӯ biên ViӋc trӯ màu và trӯ biên ÿѭӧc kӃt hӧp bҵng cách lҩy giá trӏ lӟn nhҩt giӳa hai ҧnh tin cұy tҥi mӛi pixel. KӃt quҧ kӃt hӧp ÿѭӧc thӇ hiӋn ӣ hình 2.7. NhiӉu ÿѭӧc loҥi bӓ bҵng cách sӱ dөng bӝ lӑc trung bình. Nhӳng vùng không ÿѭӧc Qӕi 100% tӟi miӅn tin cұy, ÿѭӧc coi là nhӳng ÿҥi lѭӧng dѭѫng sai và bӏ loҥi Eӓ bӣi ngѭӥng trӉ. Hình 2.7 biӇu diӉn ÿӕi tѭӧng màu trҳng và nӅn màu ÿen trong hai frame. Vӟi phѭѫng pháp này, ÿӕi tѭӧng không thuӝc nӅn cuӕi cùng ÿѭӧc ÿӏnh nghƭa tӕt hѫn hai phѭѫng pháp trӯ biên và trӯ màu. Trong frame 70, ngѭӡi ta cho mӝt cái bóng lên tѭӡng và cái bóng ÿó ÿѭӧc xác ÿӏnh nhѭ là Pӝt ÿӕi tѭӧng không thuӝc nӅn khác. Ĉó là mӝt nhұn ÿӏnh sai. 50 50 100 100 150 150 200 200 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.7: .Ӄt hӧp trӯ màu và trӯ biên cho frame 65 và 70. Nguy͍n QuǤnh Nga – CT701 Trang 39
  41. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 50 50 100 100 150 150 200 200 50 100 150 200 250 300 50 100 150 200 250 300 Hình 2.8: .Ӄt quҧ kӃt hӧp sau khi áp dөng bӝ lӑc trung bình và ngѭӥng trӉ cho frame 60 và 70. 2.2.4. Nhұn xét 6ӱ dөng thông tin màu và thông tin gradient ÿӇ thӵc hiӋn trӯ nӅn ÿã xác ÿӏnh ÿѭӧc ÿӕi tѭӧng không thuӝc nӅn mӝt cách tӕt hѫn. Giҧi thuұt vүn thӵc hiӋn tӕt khi có nhiӉu và nhӳng thay ÿәi nhӓ vӅ cѭӡng ÿӝ chiӃu sáng. Tuy nhiên, do giҧi thuұt này dӵa trên pixel nên sӵ thay ÿәi lӟn trong màu hoһc biên sӁҧnh hѭӣng ÿӃn ÿӕi tѭӧng. Nhѭ vұy nó không thành công khi có sӵ thay ÿәi ÿӝt ngӝt trong chiӃu sáng. 2.3. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa vào kӃt cҩu 2.3.1. Giӟi thiӋu Trӯ nӅn thѭӡng là các thao tác ÿҫu tiên trong các ӭng dөng thӏ giác máy, là mӝt phҫn then chӕt cӫa hӋ thӕng. KӃt quҧÿҫu ra cӫa trӯ nӅn là ÿҫu vào cӫa công viӋc xӱ lí ӣ mӭc cao hѫn có thӇ thӵc hiӋn, ví dө nhѭ: theo dõi ÿӕi tѭӧng. 6ӵ thӵc thi cӫa trӯ nӅn phө thuӝc chӫ yӃu vào kӻ thuұt mô hình hóa nӅn ÿѭӧc Vӱ dөng. Ĉһc biӋt, các cҧnh thiên nhiên ÿһt ra nhiӅu thách thӭc cho mô hình hóa nӅn do các cҧnh này trong tӵ nhiên thѭӡng có nhӳng thay ÿәi ÿӝ sáng, cây cӓÿung ÿѭa, nѭӟc gӧn sóng Mӝt giҧi thuұt trӯ nӅn tӕt là phҧi xӱ lí ÿѭӧc nhӳng vӏ trí mà tҥi ÿó xuҩt hiӋn mӝt ÿӕi tѭӧng tƭnh hoһc là mӝt ÿӕi tѭӧng cNJ di chuyӇn tӯ cҧnh. Hѫn nӳa, bóng cӫa chuyӇn ÿӝng và các ÿӕi tѭӧng cҧnh có thӇ là nguyên nhân cӫa vҩn ÿӅ. Thұm chí trong mӝt cҧnh tƭnh nhѭng vүn có sӵ thay ÿәi giӳa hai frame do nhiӉu và sӵ di chuyӇn cӫa camera. Ngoài ra, giҧi Nguy͍n QuǤnh Nga – CT701 Trang 40
  42. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p thuұt mô hình hóa nӅn phҧi thӵc thi trong thӡi gian thӵc. Trong phҫn này, mӝt Kѭӟng tiӃp cұn mӟi dӵa vào kӃt cҩu cho trӯ nӅn sӁÿѭӧc giӟi thiӋu. Mөc ÿích Fӫa phѭѫng pháp mӟi này giҧi quyӃt tҩt cҧ các khó khăn ӣ trên ngoҥi trӯ viӋc [ӱ lí bóng vì ÿây là vҩn ÿӅ rҩt khó trong mô hình hóa nӅn. 2.3.2. Toán tӱ mүu nhӏ phân cөc bӝ Phѭѫng pháp dӵa vào kӃt cҩu ÿѭӧc ÿӅ xuҩt cho trӯ nӅn dӵa vào ÿӝÿo NӃt cҩu LBP (Local Binary Pattern). LBP là phѭѫng tiӋn hӳu hiӋu cho mô tҧ NӃt cҩu. Toán tӱ gán nhãn các pixel cӫa khӕi ҧnh bҵng tҥo ngѭӥng cho lân cұn Fӫa mӛi pixel vӟi giá trӏ trung tâm và nhұn kӃt quҧ là sӕ nhӏ phân (mã LBP): p -1 p LBP (xc , y c ) = å S (g p - g c ) * 2 (2.22) p =0 Trong ÿó gc tѭѫng ӭng vӟi giá trӏ mӭc xám cӫa ÿLӇm ҧnh trung tâm (xc,yc), và g p là các giá trӏ mӭc xám cӫa P ÿLӇm ҧnh lân cұn. Hàm s(x) ÿѭӧc ÿӏnh nghƭa : ì1 x >= 0 S(x) = í (2.23) î 0 x < 0 Toán tӱ LBP gӕc ÿѭӧc thӵc hiӋn vӟi 3*3 lân cұn cӫa mӝt ÿLӇm ҧnh. Hình 2.9 là mӝt minh hӑa cho toán tӱ. Dҥng tәng quát cӫa toán tӱ LBP sӱ Gөng các lân cұn ÿӕi xӭng thành vòng tròn nhѭ trong hình 2.10. Trong trѭӡng Kӧp này gp Wѭѫng ӭng vói các giá trӏ mӭc xám cӫa P pixel trong vòng tròn vӟi bán kính R. BiӇu ÿӗ cӫa mã LBP tính toán trên các khӕi ҧnh và có thӇ sӱ Gөng ÿӇ mô tҧ kӃt cҩu cho khӕi. Tӯ (2.22) có thӇ thҩy, LBP bҩt biӃn vӟi các thay ÿәi ÿѫn trong mӭc xám. Nguy͍n QuǤnh Nga – CT701 Trang 41
  43. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p 2.3.3. Phѭѫng pháp phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng Hình 2.9: Ví dө cho tính toán mã LBP gӕc 0өc ÿích chính cӫa phѭѫng pháp là xác ÿӏnh nhӳng vùng cӫa khung video có chӭa ÿӕi tѭӧng chuyӇn ÿӝng. Phѭѫng pháp này chia khung video thành các khӕi có kích thѭӟc ÿӅu nhau bҵng cách sӱ dөng cҩu trúc lѭӟi chӗng Fөc bӝ (hình 2.11). Bҵng viӋc sӱ dөng các khӕi chӗng lҩp cөc bӝ chúng ta có thӇ trích chӑn hình dáng ÿӕi tѭӧng chuyӇn ÿӝng mӝt cách chính xác hѫn trѭӡng hӧp sӱ dөng các khӕi không chӗng lҩp. Chúng ta coi nhӳng vectѫÿһc tính cӫa khӕi ҧnh cөc bӝ theo thӡi gian nhѭ mӝt qui trình xӱ lý khӕi. Khi sӱ Gөng biӇu ÿӗ LBP là vectѫÿһc trѭng, thì xӱ lý khӕi ÿѭӧc ÿӏnh nghƭa là chuӛi thӡi gian cӫa các biӇu ÿӗ LBP. Khi ÿó biӇu ÿӗ khӕi tҥi thӡi ÿLӇm t sӁÿѭӧc biӇu diӉn là xt Hình 2.10: Lân cұn cân ÿӕi vòng tròn ÿѭӧc ÿһt vӟi nhӳng giá trӏ khác nhau cӫa P và R Nguy͍n QuǤnh Nga – CT701 Trang 42
  44. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Nhѭÿã ÿӅ cұp trong các mөc trѭӟc, LBP bҩt biӃn vӟi nhӳng thay ÿәi ÿѫn trong mӭc xám, vì vұy nó ít chӏu sӵҧnh hѭӣng do thay ÿәi cӫa ánh sáng. Do biӇu ÿӗ LBP không bao gӗm các thông tin vӅ các vӏ trí các mã LBP riêng ÿѭӧc tính toán, nên nó hӛ trӧ mô hình hóa nӅn ÿa mӭc. LBP tính toán rҩt nhanh, ÿây là ÿһc tính quan trӑng dѭӟi góc ÿӝ thi hành cөc bӝ và ÿһc biӋt trong trѭӡng hӧp này sӱ dөng nhiӅu biӇu ÿӗÿӇ mô hình mӛi khӕi. 0ӛi khӕi {x1,x2, ,xt}, ÿѭӧc mô hình hóa bӣi tұp hӧp K trӑng sӕ các biӇu ÿӗ LBP. Các bѭӟc thӵc hiӋn cұp nhұt mô hình nӅn cho mӝt khӕi: %ѭӟc 1: Sӱ dөng mӝt ÿӝÿo khoҧng cách ÿӇ so sánh biӇu ÿӗ khӕi mӟi xt Yӟi K biӇu ÿӗ mô hình ÿã có. Trong trѭӡng hӧp này có thӇ sӱ dөng ÿӝÿo biӇu ÿӗ giao nhau ÿӇÿo khoҧng cách. BiӇu ÿӗ giao nhau cӫa hai biӇu ÿӗÿã ÿѭӧc chuҭn hóa x1 và x2 ÿѭӧc ÿӏnh nghƭa nhѭ sau: H (X 1 , X 2 ) = å min(x1,i , x2,i ) (2.24) i Trong ÿó i là chӍ sӕ cӝt cӫa biӇu ÿӗ. Ngѭӡi dùng ÿӏnh nghƭa giá trӏ ngѭӥng TD cho sӵ giao nhau biӇu ÿӗ là mӝt tham sӕ phѭѫng pháp. Chú ý Uҵng nó có thӇ sӱ dөng vӟi các ÿӝ ÿo khác nhѭ Chi-square hoһc Log- likelihood. Hình 2.11: Giҧi thuұt sӱ dөng cҩu trúc lѭӟi chӗng cөc bӝ 1Ӄu không có cái nào trong sӕ các biӇu ÿӗ mô hình trùng khӟp vӟi biӇu ÿӗ mӟi, thì biӇu ÿӗ mô hình vӟi trӑng sӕ thҩp nhҩt sӁÿѭӧc thay thӃ bӣi biӇu ÿӗ mӟi và biӇu ÿӗ này sӁÿѭӧc coi là có giá trӏ trӑng sӕ ban ÿҫu thҩp. Sau ÿó, Nguy͍n QuǤnh Nga – CT701 Trang 43
  45. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p các trӑng sӕ sӁÿѭӧc chuҭn hóa ÿӇ chúng có tәng bҵng mӝt. NӃu có mӝt biӇu ÿӗ mô hình trùng khӟp vӟi biӇu ÿӗ mӟi ÿѭӧc tìm thҩy, thì sӕ cӝt cӫa biӇu ÿӗ VӁÿѭӧc cұp nhұt nhѭ sau: X k,t [i] = a b X t [i] + (1-a b )X k ,t-1[i] ,a b Î[0,1] (2.25) Trong ÿó ab là tӕc ÿӝ lҩy mүu ÿѭӧc ngѭӡi dùng ÿӏnh nghƭa. Ngoài ra, các trӑng sӕ wk,tÿѭӧc cұp nhұt nhѭ sau: w k ,t = (1-a w )w k ,t-1 + a w M k ,t ,a w Î[0,1] (2.26) 9ӟi aw là tӕc lҩy mүu ÿѭӧc ngѭӡi dùng ÿӏnh nghƭa và Mk,t =1 vӟi biӇu ÿӗ phù hӧp và = 0 các trѭӡng hӧp khác. %ѭӟc 2: Cҫn quyӃt ÿӏnh nhӳng biӇu ÿӗ nào cӫa mô hình ÿѭӧc tҥo ra thích hӧp nhҩt bҵng xӱ lí nӅn. M. Heikkila, M. Pietikainen and J. Heikkila sӱ Gөng “ÿӝ lѭu” cӫa biӇu ÿӗ nhѭ là mӝt bҵng chӭng cho ÿLӅu này. Bӣi vì “ÿӝ Oѭu ” cӫa biӇu ÿӗ thӭ k có liên hӋ trӵc tiӃp vӟi trӑng sӕ wk,t, nhӳng biӇu ÿӗ này ÿѭӧc phân loҥi theo ÿӝ giҧm cӫa trӑng sӕ. KӃt quҧ là ÿa sӕ các biӇu ÿӗ QӅn ÿӅu ӣ trên ÿӍnh cӫa danh sách. %ѭӟc 3: B biӇu ÿӗÿҫu tiên ÿѭӧc lӵa chӑn trӣ thành mô hình nӅn nhѭ sau: w1,t + + w B,t > TB ,TB Î[0,1] (2.27) Trong ÿó TB là ngѭӥng lӵa chӑn do ngѭӡi dùng ÿӏnh nghƭa. NӃu mô hình hóa mӝt nӅn, thì chӍ cҫn sӱ dөng mӝt giá trӏ nhӓ TB. Trong trѭӡng hӧp ÿa mô hình nӅn, thì mӝt giá trӏ TB lӟn ÿѭӧc sӱ dөng. Giá trӏ nhӓ TB lӵa chӑn mӝt biӇu ÿӗ chҳc chҳn nhҩt làm mô hình nӅn, ngѭӧc lҥi giá trӏ lӟn cho phép biӇu ÿӗ xt lҩy nhiӅu cҩu hình cӝt tӯ mô hình nӅn bao gӗm nhiӅu biӇu ÿӗ. Phát hiӋn ÿӕi tѭӧng không phҧi là nӅn có ÿѭӧc do sӵ so sánh biӇu ÿӗ Pӟi xt vӟi B biӇu ÿӗ nӅn ÿѭӧc lӵa chӑn tҥi thӡi ÿLӇm tӭc thӡi trѭӟc. NӃu Nguy͍n QuǤnh Nga – CT701 Trang 44
  46. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p không có giá trӏ thích hӧp, khӕi ÿó sӁ thuӝc vӅÿӕi tѭӧng. Ngѭӧc lҥi, khӕi ÿó ÿѭӧc ÿánh dҩu là nӅn. 2.4. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa vào sӵ biӃn thiên cөc Eӝ cӫa véctѫ kӃt cҩu SP 2.4.1. Giӟi thiӋu Chúng ta hãy tұp trung vào mӝt vӏ trí cӕÿӏnh trong mӝt ҧnh video và quan sát chuӛi các vectѫ trӵc quan ( ví dө: mӭc xám, tia hӗng ngoҥi, màu hay các vectѫ kӃt cҩu) tҥi mӛi vӏ trí này trong mӝt video. Giҧ thiӃt rҵng, camera không chuyӇn ÿӝng. NӃu quan sát nӅn cҧnh tҥi vӏ trí này, thì ta sӁ chӍ thҩy sӵ thay ÿәi rҩt nhӓ cӫa các vectѫ trӵc quan do có nhӳng thay ÿәi nhӓ vӅ ánh sáng và các lӛi cӫa thiӃt bӏ thu video. Mһt khác, nӃu có mӝt ÿӕi tѭӧng chuyӇn ÿӝng qua vùng này, thì chúng ta sӁ thҩy sӵ khác nhau giӳa các vùng cӫa ÿӕi Wѭӧng, nhӳng vùng này sӁ cho nhӳng kӃt cҩu khác nhau. Bӣi vұy, tính kӃt cҩu Wҥi mӝt vӏ trí ÿã cho rҩt phù hӧp ÿӇ phát hiӋn nhӳng thay ÿәi lӟn. 1Ӄu tҥi vӏ trí ÿang quan sát trong video chӍ xem xét giá trӏ cӫa mӝt ÿLӇm thì sӁ không ÿӫÿӇ có thӇ phát hiӋn có sӵ chuyӇn ÿӝng. Chҷng hҥn, xét mӝt ÿӕi tѭӧng màu trҳng di chuyӇn qua vӏ trí ÿang quan sát. Tҥi ÿѭӡng biên cӫa ÿӕi tѭӧng, sӵ biӃn ÿәi sӁ rҩt cao, nhѭng sӵ biӃn ÿәi này có thӇ rҩt thҩp ӣ trong thân ÿӕi tѭӧng. Nhѭ vұy, bҵng cách phát hiӋn sӵ biӃn ÿәi cao, chúng ta sӁ xác ÿӏnh ÿѭӡng biên cӫa ÿӕi tѭӧng chӭ không phҧi mӝt phҫn bên trong cӫa ÿӕi Wѭӧng. Trong phҫn này, thay vì chӍ xem xét các giá trӏ màu sҳc hoһc các giá trӏ Kӗng ngoҥi tҥi mӝt ÿLӇm, chúng ta xem xét tҩt cҧ các ÿLӇm trong vùng Spatiotemporal ÿѭӧc biӇu diӉn là khӕi 3D. ĈӇ mô tҧ cho các giá trӏ và giҧm nhiӉu, Ronand Mezianko và Jan Latecki ÿӅ xuҩt mӝt kӃt cҩu Spatiotemporal mô tҧ cho nhӳng khӕi 3D. Mô tҧ kӃt cҩu này là ÿҫu vào cho các kӻ thuұt phát hiӋn chuyӇn ÿӝng dӵa vào sӵ biӃn ÿәi cөc bӝ. Nguy͍n QuǤnh Nga – CT701 Trang 45
  47. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Trѭӟc tiên ÿRҥn video ÿѭӧc chia thành các khӕi spatiotemporal 3D (chҷng hҥn: 8x8x3) và áp dөng mӝt kӻ thuұt giҧm sӕ chiӅu ÿӇ thu ÿѭӧc biӇu diӉn cô ÿӑng vӅ màu sҳc, hӗng ngoҥi hay giá trӏ mӭc xám ӣ mӛi khӕi. Vectѫ NӃt cҩu SP thu ÿѭӧc cung cҩp mӝt biӇu diӉn mӕi quan hӋ giӳa kӃt cҩu và mүu chuyӇn ÿӝng trong video và ÿѭӧc sӱ dөng là dӳ liӋu ÿҫu vào cho giҧi thuұt phân tích video. Ѭu ÿLӇm cӫa công nghӋ giҧm sӕ chiӅu cho viӋc biӇu diӉn cô ÿӑng ÿã ÿѭӧc thӯa nhұn trong nén video. Ӣÿây, biӃn ÿәi cosine rӡi rҥc 3D, và nhӳng biӃn ÿәi wavelet 3D cNJng ÿѭӧc sӱ dөng ÿӇ rút gӑn nhӳng giá trӏ màu hoһc giá trӏ mӭc xám cӫa phҫn lӟn các ÿLӇm ҧnh trong khӕi cho mӝt vài vectѫ ÿã Oѭӧng tӱ hóa. Tuy nhiên, kӻ thuұt này không hoàn toàn phù hӧp ÿӇ phát hiӋn nhӳng ÿӕi tѭӧng chuyӇn ÿӝng, vì nhӳng thành phҫn thu ÿѭӧc không cung cҩp nhӳng ÿһc ÿLӇm cҫn thiӃt ÿӇ phân biӋt các khӕi. Ngѭӧc lҥi, phѭѫng pháp ÿѭӧc Ronand Mezianko và Dragoljub Pokrajac [10] ÿӅ xuҩt ӣÿây có thӇ thu ÿѭӧc Vӵ khác nhau thích hӧp nhҩt cho tұp các khӕi 3D ÿã cho. ĈӇ làm ÿѭӧc vҩn ÿӅ này, cҫn có mӝt sӵ tác ÿӝng tӯ ngoài vào và mӝt biӃn ÿәi cҧm ngӳ cҧnh sao cho sӵ thӇ hiӋn cӫa khӕi ÿã cho phө thuӝc vào ngӳ cҧnh cӫa nó. ViӋc ӭng Gөng phѭѫng pháp phân tích thành phҫn chính (Principal Component Analysis – PCA ) ÿã ÿáp ӭng ÿѭӧc yêu cҫu này. Nhѭÿã trình bày ӣ trên, kӃt cҩu tҥi mӝt vӏ trí ÿã cho trên video rҩt thích Kӧp cho nhӳng thay ÿәi lӟn khi mà ÿӕi tѭӧng chuyӇn ÿӝng qua vӏ trí quan sát. %ӣi vұy cҫn phҧi có mӝt phѭѫng pháp phát hiӋn chuyӇn ÿӝng dӵa trên cѫ sӣ nhӳng biӃn ÿәi cөc bӝ cӫa vectѫ kӃt cҩu SP. Ronand Mezianko và Dragoljub Pokrajac xác ÿӏnh là cҫn ÿo trong mӝt cӱa sә giӟi hҥn và càng ngҳn càng tӕt. +ӑÿӏnh nghƭa biӃn ÿәi cөc bӝ là giá trӏ riêng lӟn nhҩt cӫa vectѫ kӃt cҩu SP trong mӝt khoҧn thӡi gian nhӓ. Nó ÿѭӧc tính toán bҵng cách áp dөng phѭѫng pháp PCA vào ma trұn hiӋp phѭѫng sai cӫa vectѫ kӃt cҩu SP trong mӝt khoҧng thӡi gian nhӓ. Nhѭ vұy trong cách tiӃp cұn này, ta sӱ dөng phѭѫng Nguy͍n QuǤnh Nga – CT701 Trang 46
  48. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p pháp PCA hai lҫn, lҫn ÿҫu dùng ÿӇ tính toán vectѫ kӃt cҩu SP, và lҫn thӭ hai dùng ÿӇ tính toán sӵ biӃn ÿәi cӫa vectѫ kӃt cҩu. Sau ÿó sӱ dөng mӝt ngѭӥng ÿӝng ÿӇ quyӃt ÿӏnh xem ÿây là ÿӕi tѭӧng chuyӇn ÿӝng hay là nӅn tƭnh tҥi vӏ trí không gian ÿã cho. 2.4.2. BiӇu diӉn video vӟi vectѫ kӃt cҩu SP Các vectѫÿѭӧc mô tҧ là nhӳng mҧng 3D cӫa mӭc xám hoһc các giá trӏ pixel hӗng ngoҥi ÿѫn sҳc gi,j,t tҥi thӡi ÿLӇm t, vӏ trí pixel (i,j). Mӝt video ÿѭӧc ÿһc trѭng bӣi chiӅu thӡi gian là Z tѭѫng ӭng vӟi sӕ khung, và hai chiӅu không gian ÿһc trѭng sӕ vectѫ trong phѭѫng ngang và phѭѫng thҷng ÿӭng cӫa mӛi frame. Các ҧnh trong video ÿѭӧc chia thành chuӛi nhӳng hình vuông rӡi rҥc NBLOCK× NBLOCK ( chҷng hҥn hình vuông 8x8), nhӳng hình vuông này bao trùm toàn bӝҧnh. Nhӳng khӕi spatiotemporal 3D có ÿѭӧc là do sӵ kӃt hӧp Fӫa nhiӅu hình vuông liên tiӃp trên các frame tҥi cùng mӝt vӏ trí cӫa video. Ví Gө sӱ dөng 8x8x3 khӕi rӡi rҥc trong không gian nhѭng chӗng lҩp vӅ thӡi gian, khi ÿó, hai khӕi ӣ cùng mӝt vӏ trí và tҥi thӡi ÿLӇm t và t+1 có chung mӝt hình vuông. Thӵc tӃ là nhӳng khӕi 3D nӕi tiӃp nhau cho phép chúng ta phát hiӋn ÿѭӧc chuyӇn ÿӝng trong video vӟi tҫn sӕ thӡi gian thҩp. Nhӳng khӕi 3D thu ÿѭӧc ÿѭӧc biӇu diӉn thành các vectѫ 192 chiӅu cӫa mӭc xám hoһc là nhӳng giá trӏÿLӇm ҧnh hӗng ngoҥi ÿѫn sҳc. Các khӕi ÿѭӧc biӇu diӉn bҵng các vectѫ N chiӅu bi,j,t vӟi chӍ sӕ không gian ( i,j )và tҥi thӡi ÿLӇm t. Các vectѫ bi,j,t bao gӗm các giá trӏ mӭc xám gi,j,t Fӫa các pixel trong khӕi 3D tѭѫng ӭng. Nhѭ vұy, nhӳng khӕi ÿã cho vӟi chӍ Vӕ không gian (i,j) và tҥi thӡi ÿLӇm t, tѭѫng ӭng vӟi vectѫ khӕi bi,j,t chӭa ÿӵng nhӳng giá trӏÿLӇm ҧnh gi,i,t tӯ nhӳng tӑa ÿӝ không gian: (NBLOCK-1) ´ (I-1)+1, , NBLOCK ´ I (NBLOCK-1) ´ (J-1)+1, , NBLOCK ´ J và tӯ khung t-T t+T. Vӟi T là tәng sӕ khung. Nguy͍n QuǤnh Nga – CT701 Trang 47
  49. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Nhѭ vұy chiӅu dài N cӫa vectѫ khӕi sӁ bҵng NBLOCK x NBLOCK x (2T+1). ĈӇ rút gӑn chiӅu cӫa bi,j,t trong khi vүn duy trì ÿѭӧc thông tin trong phҥm vi lӟn nhҩt có thӇ, ta tính mӝt phép chiӃu cӫa vetor khӕi ÿѭӧc chuҭn hóa thành mӝt vectѫ có ÿӝ dài thҩp hѫn K (K<<N) bӣi viӋc sӱ dөng ma trұn chiӃu K PCA P i,j ÿӇ tính cho tҩt cҧ bi,j,t tҥi vӏ trí không gian (i,j) cӫa video. KӃt quҧ * K vectѫ kӃt cҩu không gian b i,j,t= Pi,j *bi,j,t cung cҩp mӕi quan hӋ giӳa biӇu diӉn kӃt cҩu và mô hình chuyӇn ÿӝng trong video, và chúng ÿѭӧc sӱ dөng là phҫn ÿҫu vào cӫa giҧi thuұt phát hiӋn chuyӇn ÿӝng và sӵ di chuyӇn cӫa ÿӕi Wѭӧng. K ĈӇ tính toán P i,j, các tác giҧÿã sӱ dөng các giá trӏ phân tích trong các tài liӋu [11,12]. Ma trұn cӫa tҩt cҧ vectѫ khӕi ÿѭӧc chuҭn hóa bi,j,t trong vӏ trí (i,j) ÿѭӧc sӱ dөng ÿӇ tính ma trұn hiӋp phѭѫng sai NxN chiӅu Si,j. Ma trұn chiӃu PCA Pi,j cho vӏ trí không gian (i,j) ÿѭӧc tính tӯ ma trұn hiӋp phѭѫng Si,j. Ma trұn chiӃu P(i,j) kích thѭӟc NxN biӇu diӉn cho N thành phҫn chính. Bҵng viӋc chӍÿѭa ra nhӳng thành phҫn chính tѭѫng ӭng vӟi K giá trӏ riêng lӟn K nhҩt, ta thu ÿѭӧc P i,j. 2.4.3. Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng dӵa trên biӃn thiên cөc bӝ Ý tѭӣng cӫa phѭѫng pháp này là dӵa vào sӵ biӃn ÿәi cӫa vectѫ cөc bӝ. Trong thӵc tӃ, vӟi mӛi vӏ trí (x,y) chúng ta xét các vectѫ: Vx,y,t-w, Vx,y,t-w+1, , Vx,y,t, , Vx,y,t+w Wѭѫng ӭng vӟi cӱa sә có kích thѭӟc 2W+1 xung quanh thӡi gian t, * Ӣÿây, vi,j,t = b i,j,t là vectѫ kӃt cҩu SP. Vӟi nhӳng vectѫ này, chúng ta tính ma trұn hiӋp phѭѫng sai Cx,y,t. Chúng ta gán giá trӏ tҥi vӏ trí video spatiotemporal ÿã cho bӣi giá trӏ biӃn thiên cөc bӝ. Ĉӝÿo biӃn thiên này sӁÿѭӧc gӑi là ÿӝÿo chuyӇn ÿӝng: mm(x, y,t) = L x, y,t (2.28) Nguy͍n QuǤnh Nga – CT701 Trang 48
  50. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Trong ÿó L x, y,t là giá trӏ riêng lӟn nhҩt cӫa Cx,y,t. Khi có sӵ hiӋn diӋn Fӫa mӝt ÿӕi tѭӧng chuyӇn ÿӝng tҥi vӏ trí (x,y,t), giá trӏÿӝÿo mm(x,y,t) chuyӇn ÿӝng sӁ lӟn . Cuӕi cùng, viӋc gán nhӳng vӏ trí trên video là chuyӇn ÿӝng hoһc là nӅn VӁ phө thuӝc vào sӵÿӝÿo chuyӇn ÿӝng là lӟn hay nhӓ hѫn so vӟi ngѭӥng chuyӇn ÿӝng. Ӣÿây các tác giҧÿã sӱ dөng giҧi thuұt phân ngѭӥng tӵÿӝng ÿӇ xác ÿӏnh giá trӏ ngѭӥng tҥi vӏ trí (x,y,t) dӵa vào các giá trӏ mm(x,y,s) vӟi các giá trӏ thӡi gian (s=1, ,t-1). Ĉҫu tiên, tính giá trӏ trung bình meanl và ÿӝ lӋch chuҭn stdl (sӱ dөng giá trӏ trung bình ÿӝng) cho mӑi mm(x,y,s) vӟi s=1, ,t-1 ÿã ÿѭӧc gán nhãn tƭnh. 0ӝt ÿӕi tѭӧng chuyӇn ÿӝng ÿѭӧc phát hiӋn nӃu : meanrw-meanl>C1 * stdl (2.29) vӟi C1 là hҵng sӕ và 1 w meanrw = åmm(x, y,t +t ) (2.30) w t =1 0ӝt chuyӇn ÿӝng ÿѭӧc phát hiӋn ÿѭӧc chuyӇn vӅ trҥng thái tƭnh nӃu : meanrw-meanl<C2 * stdl (2.31) Yӟi C2<C1 là hҵng sӕ thӭ hai. Hình 2.12: Ĉӗ thӏ cӫa biӃn thiên cөc bӝ mm qua thӡi gian Nguy͍n QuǤnh Nga – CT701 Trang 49
  51. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p CHѬѪNG 3: THӰ NGHIӊM PHÁT HIӊN ĈӔI TѬӦNG ĈӜT NHҰP 3.1. Mô tҧ bài toán 'ӳ liӋu ÿҫu vào dùng cho bài toán phát hiӋn ÿӕi tѭӧng ÿӝt nhұp là mӝt ÿRҥn video. NӃu trong ÿRҥn video này có sӵ chuyӇn ÿӝng cӫa ÿӕi tѭӧng thì khoanh vùng các ÿӕi tѭӧng chuyӇn ÿӝng ÿó. 3.2. Môi trѭӡng test  Ӭng dөng ÿѭӧc cài ÿһt thӱ nghiӋm bҵng ngôn ngӳ lұp trình C# cho Microsoft.NET plaform phát triӇn trên hӋÿLӅu hành windows XP, bӝ xӱ lý Pentium 2.8GHz, 512 MB bӝ nhӟ. 3.3. 0ӝt sӕ giao diӋn Khi bҳt ÿҫu chҥy chѭѫng trình có giao diӋn nhѭ sau: Hình 3.1 Giao diӋn chính cӫa chѭѫng trình Nguy͍n QuǤnh Nga – CT701 Trang 50
  52. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Các kӃt quҧ: (a) (b) Nguy͍n QuǤnh Nga – CT701 Trang 51
  53. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p (c) Hình 3.2 (a), (b), (c) KӃt quҧ sau khi thӵc hiӋn thuұt toán vӟi video có Gҥng *.AVI 3.4. Ĉánh giá Giҧi thuұt sӱ dөng ÿӇ phát hiӋn chuyӇn ÿӝng thӵc hiӋn tѭѫng ÿӕi tӕt trong chѭѫng trình thӱ nghiӋm. Chѭѫng trình thӱ nghiӋm ÿã phát hiӋn và ÿóng khung nhӳng ÿӕi tѭӧng chuyӇn ÿӝng trong nhӳng video ÿӏnh dҥng *.AVI có sҹn, hoһc qua các thiӃt bӏ thu (camera, webcam ). Tuy nhiên khi thӵc hiӋn phát hiӋn chuyӇn ÿӝng trong các ÿRҥn video có nhiӅu ÿӕi tѭӧng, tӕc ÿӝ chuyӇn ÿӝng cӫa các ÿӕi Wѭӧng tѭѫng ÿӕi lӟn thì viӋc ÿánh dҩu nhӳng ÿӕi tѭӧng chuyӇn ÿӝng gһp nhiӅu khó khăn (hình 3.3). KӃt quҧ kiӇm tra vүn bӏ ҧnh hѭӣng bӣi sӵ di chuyӇn cӫa camera và bóng cӫa các ÿӕi tѭӧng (hình 3.4). ĈӇ chѭѫng trình có thӇӭng dөng vào thӵc tӃ, cҫn phҧi phát triӇn thêm ÿӇ chѭѫng trình có thӇ phát Nguy͍n QuǤnh Nga – CT701 Trang 52
  54. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p hiӋn nhӳng ÿӕi tѭӧng chuyӇn ÿӝng vӟi tӕc ÿӝ lӟn, khӱ nhiӉu và giҧm tác ÿӝng cӫa môi trѭӡng tӟi kӃt quҧ phát hiӋn. Hình 3.3 Phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng nhanh Hình 3.4 Camera bӏ rung Nguy͍n QuǤnh Nga – CT701 Trang 53
  55. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p .ӂT LUҰN Phát hiӋn chuyӇn ÿӝng cӫa ÿӕi tѭӧng trong ÿRҥn video là mӝt ÿӅ tài vӟi nhiӅu ӭng dөng trong các lƭnh vӵc ÿӡi sӕng ÿһc biӋt là ngành bҧo ÿҧm trұt tӵ an ninh. Trong ÿӗ án tӕt nghiӋp này em ÿã trình bày mӝt sӕ phѭѫng pháp phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng cùng các ѭu và nhѭӧc ÿLӇm cӫa tӯng phѭѫng pháp khi áp dөng chúng. Tùy tӯng yêu cҫu cө thӇ vӅ thӡi gian, vӅ chҩt lѭӧng và ÿһc ÿLӇm cӫa video cҫn xӱ lý mà chúng ta chӑn sӱ dөng phѭѫng pháp phát hiӋn thích hӧp. Bên cҥnh viӋc ÿѭa ra mӝt cҧi tiӃn cho phѭѫng pháp phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng, khóa luұn cNJng ÿã cài ÿһt thӱ nghiӋm thuұt toán so sánh nӅn cho bài toán phát hiӋn ÿӕi tѭӧng ÿӝt nhұp vӟi các file video *.AVI. Ĉây là chѭѫng trình mang ý nghƭa demo kӻ thuұt. Ngoài ra ta có thӇ phát triӇn chѭѫng trình tiӃp ÿӇ có thӇ phát hiӋn ÿӕi tѭӧng chuyӇn ÿӝng trên tҩt cҧ các file video khác nhҵm mang lҥi nhiӅu hiӋu quҧ rӝng rãi hѫn. Tuy nhiên do hҥn chӃ vӅÿLӅu kiӋn và thӡi gian, khoá luұn sӁ không thӇ tránh khӓi nhӳng thiӃu xót. Kính mong ÿѭӧc sӵÿóng góp ý kiӃn cӫa thҫy cô và các bҥn, ÿӇÿӅ tài nghiên cӭu cӫa em ÿѭӧc hoàn thiӋn hѫn. Nguy͍n QuǤnh Nga – CT701 Trang 54
  56. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p TÀI LIӊU THAM KHҦO [1]. Cao Chánh Nguyên HiӇn, Khѭѫng Trѭӡng Giang, “ Nghiên cͱu ph˱˯ng phát phát hi͏n ÿ͙i t˱ͫng chuy͋n ÿ͡ng trong video và ͱng Gͭng ” -Trѭӡng ĈH KHTN TP Hӗ Chí Minh. [2]. .ӻ thuұt trӯҧnh và ӭng dөng trong phim cҧnh- Ĉӗ án tӕt nghiӋp NguyӉn Thӏ Thúy Hòa – TS Ĉӛ Năng Toàn hѭӟng dүn [3]. Motion Detection Algorithms – Andrew Kirillov. [4]. NguyӉn Quӕc Tuҩn, NguyӉn Văn Kӹ Cang, Phan Vƭnh Phѭӟc, “ Phân tích t͹ÿ͡ng dͷ li͏u video s͙ h͟ trͫ truy tìm thông tin th͓ giác d͹a vào n͡i dung ” - Trѭӡng ĈH KHTN TP Hӗ Chí Minh. [5]. Sen-Ching S. Cheung and Chandrika Kamath, “ Robust techniques for background subtraction in urban traffic video ”Center for Applied Scientific Computing Lawrence Livermore National Laboratory [6]. R.Cucchiara, M. Piccardi, and A. Prati, “ Detecting moving objects, ghosts, and shadows in video streams ” IEEE Transactions on Pattern Analysis and Machine Intelligence 25, pp. 1337-1342, Oct 2003. [7]. A. Prati, I. Mikic, M. Trivedi, and R. Cucchiara, “ Detecting moving shadows: algorithms and evaluation ” IEEE Transactions on Pattern Analysis and Maching Intelligence 25, pp. 918-923, July 2003. [8]. Thuan D. Vong, “Background Subtraction Using Color and Gradient Information”, Department of Electrical and Computer Engineering Clemson University Clemson. [9]. M. Heikkila, M. Pietikainen and J. Heikkila, “A Texture-based Method for Detecting Moving Objects”, Infotech Oulu and Nguy͍n QuǤnh Nga – CT701 Trang 55
  57. Ĉ͛ án t͙t nghi͏p Tìm hi͋u m͡t s͙ ph˱˯ng pháp phát hi͏n ÿ͙i t˱ͫng ÿ͡t nh̵p Department of Electrical and Information Engineering P.O. Box 4500 FIN-90014 University of Oulu, Finland. [10]. Roland Miezianko1 , Dragoljub Pokrajac2, “ Motion Detection Based on Local Variation of Spatiotemporal Texture ”, 1Temple University, CIS Dept., Philadelphia, PA, 2 Delaware State University, CIS Dept., Dover, DE. [11]. Duda, R., P. Hart, and D. Stork, Pattern Classification, 2nd edn., John Wiley & Sons, 2001. [12]. Flury, B. A First Course in Multivariate Statistics, Springer Verlag. Nguy͍n QuǤnh Nga – CT701 Trang 56