Thảo luận: Computer Vision & Machine Learning

Discussion in 'Computer science & Electrical Engineering' started by cuchuoi, Jul 12, 2008.

  1. cuchuoi

    cuchuoi Củ chuối

    Chào cả nhà,

    Mình muốn mở thread này với

    Mục tiêu:
    - Trao đổi những topics, problem trong Computer Vision & Machine Learning (CVML).
    - Chia sẽ những thông tin, kinh nghiệm liên quan CVML.
    - Bạn nào đang làm cùng hướng có thể lên đây cùng trao đổi thêm.
    - Những bạn SV ở nhà đang học under, muốn biết thêm thông tin về hướng này có thể post câu hỏi lên đây.

    Đối tượng:
    - Không phân biệt trình độ, giới tính, tôn giáo, dân tộc,vvv, chỉ cần yêu thích đề tài này, sẽ được welcome tham gia. jk:))

    Rào trước:
    - Mình không phải là expert về hướng này, mình chỉ bắt đầu nghiên cứu được 1 thời gian ngắn, chỉ mong mở 1 topic để mọi người cùng chia sẽ.
    - Có thể sẽ tranh thủ vao đọc topic này vào cuối tuần, nếu có chậm trể trong việc trả lời, xin mọi người thông cảm trước.
     
  2. cuchuoi

    cuchuoi Củ chuối

    Các top Journal và Coference liên quan

    +Journal
    1-Computer Vision
    IEEE Trans PAMI
    IJCV

    2-Machine Learning
    JMLR

    +Conferences
    1-Computer Vision
    CVPR
    ICCV
    ECCV

    2-Machine Learning
    ICML
    ECML

    4-Computer Graphics
    SIGGRAPH
     
    seagull and loginguestvn like this.
  3. cuchuoi

    cuchuoi Củ chuối

    Các lab mạnh về Computer Vision

    MIT -
    William Freeman
    Alex Penland (not active right now)

    CMU - Robotic Institute
    Takeo Kanade
    Simon Baker (now at MSR)
    Rahul Sukthankar (with Intel)
    Alexei (Alyosha) Efros
    Martial Hebert

    Berkeley
    Jonh Canny (not active - famous with his Canny's edge detector)
    Jitendra Malik
    Trevor Darrell

    UIUC
    Thomas Huang
    David Forsyth (author of "Computer Vision: A Modern Approach")
    Narendra Ahuja

    Caltech
    Pietro Perona

    USCD
    David Kriegman
    Serge Belongie

    Princeton
    Fei-Fei Li

    GATECH
    James Regh

    UMD
    Larry S. Davis

    USC
    Gerard Medioni
    Ram Nevatia

    NYU
    Rob Fergus

    UBC (Canda)
    David Lowe (famous with his SIFT)

    Simon Fraser University(Canada)
    Greg Mori

    Other: Quang-Tuan Luong (Stanford Research Institute), he is not longer active in the filed. He had spent his 20 years for doing research in 3D vision. Now he is enjoying photography and traveling around the world. The only Vietnamese scientist i know who are so famous in this feild

    Trên đây là lít các lab mạnh ở Ú&Canada. Sẽ cập nhật phần EU + Asia
     
    Last edited: Jul 12, 2008
  4. Springer

    Springer Thèm thuồng

    Có ai làm về face processing không nhỉ? Đây là một topic khá nổi trong CV, bao gồm các vấn đề chính là:
    - Face detection.
    - Face tracking.
    - Face recognition.

    Tôi có làm về lĩnh vực này một thời gian và bây giờ lại tiếp tục đào xới. Nếu có ai cùng interest để bàn luận trao đổi thì hay quá. Thực ra không nhất thiết phải có exact the same research direction vì mấy vấn đề này liên quan tương đối nhiều đến các lĩnh vực như Pattern recognition, Machine learning, Biometrics hay Image processing. Các kỹ thuật của nó cũng có thể apply cho nhiều class tương đương.

    Bổ sung khu vực EU giúp cuchuoi luôn. Các lab này làm về Face recognition, biometrics và cũng là nhưng nơi mạnh về CV:

    CROATIA


    FINLAND


    FRANCE


    GERMANY


    ISRAEL


    ITALY

     
  5. Springer

    Springer Thèm thuồng

    Tiếp (Phần này đã được post trong mục good research lab by areas rồi nhưng tôi bưng lên đây cho tiện theo dõi):

    KOREA

    SLOVENIA


    SINGAPORE


    SPAIN


    SWITZERLAND


    THE NETHERLANDS


    TURKEY


    UNITED KINGDOM
    Queen Mary Vision Laboratory, Queen Mary University of London

    FACE RECOGNITION HOMEPAGE, update thông tin khá đầy đủ về lĩnh vực này:


    http://www.face-rec.org/research-groups/
     
    loginguestvn and cuchuoi like this.
  6. cuchuoi

    cuchuoi Củ chuối

    Vision Group in EU+Asia

    UK
    Oxford
    Andrew Zisserman
    David Murray
    Philip H. S. Torr
    Cambridge
    Roberto Cipolla

    France
    INRIA
    Cordelia Schmid
    Bill Triggs
    Jean Ponce
    Peter Sturm

    KTH
    Ivan Laptev

    ISRAEL
    Michal Irani - Wezmann Institute of Science
    Shimon Ullman - Wezmann Institute of Science

    Switzerland
    Luc Van Gool - ETH-Zentrum
    PASCAL FUA - EPFL

    Pacific Asia
    Long Quan (Hong Kong University of Science and Technology)
    Katsushi Ikeuchi (The U of Tokyo)
    Tat-Jen Cham (NTU, Singapore)
    Stan Z. Li (Chinese Academy of Sciences)
    David Suter (ANU, Australia)
    Xiaoou Tang (Microsoft Research Asia, China)
    Tieniu Tan (National Lab of Pattern Recognition, China)
     
    Last edited: Jul 12, 2008
    loginguestvn likes this.
  7. pateheo

    pateheo Thèm thuồng

    Bác Curchuoi nên post các trends hot và cutting-edge hiện nay. Sau đó mới nên tập trung vào lab nôi tiếng. CVML có quá nhiều topics, ta phải cô lại chứ không loãng! Em thấy cái web http://www.videolectures.net có rất chi là nhiều topics ML hay vãi. Lectures, slides, talks, recorded conferences... đủ cả.
     
    loginguestvn, Cof and cuchuoi like this.
  8. cuchuoi

    cuchuoi Củ chuối

    Thanks bác for good comments. Thật ra mình định giới thiệu conference, journal, people in the field trước. Rồi sau đó sẽ nói đến background, so on...
     
  9. goahead

    goahead Thèm thuồng

    @springer: Tôi cũng đang làm về face recongition đây, mong được thảo luận với bác.

    @pateheo: tôi cũng là thành viên trung thành của lecture video, công nhận có nhiều video đặc biệt là machine learning.
     
  10. tacke

    tacke Thèm thuồng

    loginguestvn likes this.
  11. Springer

    Springer Thèm thuồng

    Bác có thể mô tả research direction và ideas định thực hiện được được không? Tôi đang collect data, có gì hay cũng sẽ post lên để cùng tham khảo. Rất vui được thảo luận cùng bác!
     
  12. pateheo

    pateheo Thèm thuồng

    Chuyện là thế này... Em đang định làm về traffic congestion prediction, đại loại là dự báo trước tình trạng kẹt xe ở các ngã >=4 trước 5 -> 10 phút. Sau vài lần sợt thì nhận thấy cần phải phát hiện pattern gridlock tiềm ẩn từ tình trạng giao thông ở thời điểm hiện hành. Cái gridlock đại loại cũng giống khái niệm deadlock, tức là luồng xe nào cũng háo hức đi, cho nên cả 4 con dê ngã xuống cầu. Xác định các lĩnh vực cần tấn công thì em thấy có tracking, surveillance, traffic flow, object categorization, và một phương pháp unsupervised learning nào đấy. Đại loại ban đầu là vậy, cái khó là, với bài toán dự đoán thì phương pháp học nào là phù hợp, cụ thể với dữ liệu đầu vào là hướng di chuyển, vận tốc trung bình của flow,...
     
  13. SSL

    SSL Thèm thuồng

    Mình không rõ trong traffic/vision applications thì tracking làm như thế nào, nhưng thường thì người ta dùng Particle filter để predict/track moving sources. Nó là 1 dạng sequential Monte Carlo method (recursive Bayesian filter). Inputs như bạn muốn, đó là vận tốc, vị trí ở thời điểm trước, hướng di chuyển, v.v...Có tương đối nhiều tài liệu về particle filters, bạn có thể tìm đọc thêm ví dụ như paper sau:
    S. Godsill A. Doucet and C. Andrieu, “On sequential monte carlo sampling methods for bayesian filtering,” Statistics and Computing, vol.10, pp. 197–208, 2000.
     
  14. Springer

    Springer Thèm thuồng

    Đúng là bài toán của pateheo cần một cách tiếp cận khác với face recognition. Khi muốn predic traffic thì vấn đề là cần detect và track được các moving object, apply face recognition vào đây là không phù hợp.
     
  15. aivoges

    aivoges Thèm thuồng

    Thực ra áp dụng computer vision vào bài toán của pateheo dễ hơn face detection nhiều. Cũng chẳng cần tracking gì ráo. Giả sử bác cần đếm lưu lượng xe cộ đi qua một intersection nào đấy, bác chỉ cần đặt một cái camera (fixed) trước cái intersection này khoảng vài trăm mét. Vì là fixed camera nên các vấn đề về image processing sẽ dễ dàng hơn nhiều, bác có thể lấy một cái ảnh chup highway lúc chưa có xe cộ gì hết để làm background, sau đó subtract từng video frame với cái background này thì bác sẽ tìm được thằng nào là cars (moving objects). Rồi đếm số lượng cars đi qua một điểm nào đó chia cho tổng thời gian thì sẽ ra traffic flow. Bác so sánh cái traffic flow estimate này với highway capacity (thường là 2200 veh/lane/hour), nếu nó tiến dần đến capacity thì tức là chuẩn bị congested. Bác có thể dự đoán khi nào congestion diễn ra bằng cách extrapolate dựa vào data có sẵn, rồi theo đó điều chỉnh lưu lượng xe cộ cho phù hợp.
     
  16. Springer

    Springer Thèm thuồng

    Nếu chỉ xử lý theo frame đơn lẻ thì dễ bị thiếu một vài object đang khuất sau những object khác (sau xe to chẳng hạn). Có thể để camera cao lên để giải quyết vụ này :D nhưng vấn đề khác nữa là phải segment được các object khác nhau như car, motorbike, hay bicycle. Đường như ở Việt Nam thì sẽ phức tạp hơn rất nhiều :D.
     
  17. jetly

    jetly Thèm thuồng

    Theo mình được biết thì việc tìm được thằng moving objects cũng không đơn giản nếu có nhiễu môi trường (ánh sáng thay đổi, shadows,...). Có rất nhiều hướng tiếp cận cho vấn đề lấy này. Nhưng hiện tại, theo mình được biết statistical approaches là đạt được hiệu quả cao nhất. Lúc đầu mình nghĩ là lấy các frame subtracts cái background là sẽ lấy được các moving objects. Nhưng thực sự không đơn giản như thế!

    Hi vọng được trao đổi thêm :)!
     
  18. pateheo

    pateheo Thèm thuồng

    ĐÚng là lúc đầu những ai bít về backgrnd subtracting cũng nghĩ bài toán tracking đã trở nên đơn giản hơn nhiều nhưng qua khảo sát một số pp thì tui thấy sự thực không phải như vậy. Còn nhiều thứ linh tinh, mà trong đó illumination, occlusion, weather condition, ảnh hưởng quá nhiều. Với dk cụ thể như đường sá ở VN thì quả thật chưa thấy paper nào nghiên kíu. Bởi zì đường bọn Tây quá good, lanes rõ ràng, toàn là xế hộp,detect mấy cái hộp thì còn có mô hình cố định. Tui nghĩ đám xe máy, rồi xe lôi, xe đạp, bus, truck thập cẩm với nhau thì hơi mệt. Hơn nữa, nếu nghĩ kỹ thì congestion hay không chưa chắc đã phụ thuộc vào mật độ. Đôi khi chỉ cần 2 xe bus cua ngang là toi rồi. Nhưng chắc chắn điều này làm tôi quan tâm: liệu chỉ cần đếm xe là đủ hay phải exploit thêm các mô hình kẹt xe cao cấp hơn? :) Có một cách đếm xe đơn giản là chăng ngang một sợi dây rung, rồi cứ đếm bánh xe đè qua nó, thì dễ dàng đo đượng thông lượng xe cộ, không cần phải camera hay CV gì cả. Cái đó bọn Tây cũng làm rồi.
     
  19. aivoges

    aivoges Thèm thuồng


    Có nhiều cách để overcome mấy thứ như weather conditions, lighting conditions mà bác. Thay vì dùng chỉ 1 image để làm background bác có thể xây dựng cái Gaussian mixture-based background model [1] dựa trên một loạt các frames khi bác initialize thuật toán của bác. Đặc điểm của mấy thứ như lighting conditions, etc, là thay đổi từ từ, vậy nên bác có thể dùng mấy cái model maintenance methods [2] để update cái background model của bác từ từ theo thời gian. Hoặc bác cũng có thể re-initialize cái background model của bác định kỳ.

    Đúng là traffic congestion có thể bị ảnh hưởng bới các unpredictable factors khác như accident, lane closure hay như bác nói 2 cái xe bus cũng có thể gây tắc nghẽn. Cái vehicle counting em chỉ lấy ví dụ thế thôi, có rất nhiều congestion model mà bác có thể dùng. Bác có thể phân tích shockwave propagation hoặc vehicle speed cũng có thể predict được congestion, tuy nhiên cái nào cũng có ưu nhược điểm riêng. Tuỳ vào ứng dụng của bác mà áp dụng model nào thôi. Chẳng hạn nếu bác chỉ cần muốn biết xem lưu lượng xe cộ đổ vào một highway nào đó có quá tải và gây nghẽn xe thường xuyên không (bỏ qua các unpredictable factors khác như accident, ...) thì đếm số lượng vehicle nói chung là đủ.

    Với những bài toán phức tạp hơn chẳng hạn như bác muốn đếm số lượng vehicle đi qua một cái intersection hoặc roundabout, muốn biết bao nhiêu cái rẽ phải, bao nhiêu cái rẽ trái, đi từ hướng nào tới hướng nào thì bác phải áp dụng các thuật toán tracking phức tạp hơn chẳng hạn như Kalman filter, Markov chain Monte Carlo, particle filter như bác SSL đã nói ở trên.

    References:
    [1] J. Zhang. Nonlinear prediction for Gaussian mixture image models. IEEE Transactions on Image Processing, Volume 13, NO. 6:836–847, June 2004.
    [2] Z. Zivkovic. Motion Detection and Object Tracking. PhD thesis, University of Twente, The Netherlands, 2003.
     
    thanhnguyentang and cuchuoi like this.
  20. pateheo

    pateheo Thèm thuồng

    Comment của bác thật quý báu. Cảm ơn bác nhiều. He
     

Share This Page