機械社區(qū)

 找回密碼
 注冊會員

QQ登錄

只需一步,快速開始

搜索
查看: 1195|回復: 19
打印 上一主題 下一主題

聊聊視覺算法

[復制鏈接]
跳轉到指定樓層
1#
發(fā)表于 2024-8-30 14:51:17 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
前陣子有幾個供應商來推薦他們的視覺設備,跟我聊視覺深度學習,后來我問了幾個問題,答不上來就不了了之了,說明自己都不知道用來干嘛的。這個細分領域,亦是魚龍混雜,做的好的少之甚少。

我問了5個問題:

1. 是否可以遷移訓練模型?例如之前用2000張圖像的目標檢測模型,新發(fā)現(xiàn)的幾張NG圖像加入重新訓練?

2. 你們家的深度學習是基于哪幾個深度學習框架的?
--- TensorFlow
--- pytorch
--- Keras
--- Caffe
--- Theano
--- CNTK

3. 你們的視覺深度學習目前支持哪幾種應用場景?
--- 分類檢測
--- 目標檢測
--- 語義分割
--- 還是其他?

4. 是否有獨立的標注軟件?(他們問什么是標注軟件?)
--- 標注軟件就是人工把缺陷位置圈出來,這就是標注。

5. 你們目前的模型是什么格式的?是否可以使用通用的ONNX推理?


評分

參與人數(shù) 1威望 +100 收起 理由
老鷹 + 100

查看全部評分

回復

使用道具 舉報

推薦
發(fā)表于 2024-8-31 17:08:48 | 只看該作者
本帖最后由 huhu2 于 2024-8-31 18:57 編輯

現(xiàn)在只剩下兩家了,google的TENSORFLOW和facebook的pytorch,caffe是奄奄一息,其他的墳頭長草了吧!遷移學習應該是指比如你原先識別的是黑白的中文或數(shù)字,換為彩色的中文或數(shù)字是否也可以快速的識別。另外ONNX主要是把訓練好的模型發(fā)布到網(wǎng)上服務器上給用戶使用,tensorflow用自家的軟件部署或發(fā)布,其他家都用ONNX部署吧。

點評

優(yōu)秀  發(fā)表于 2024-8-31 17:25
回復 支持 2 反對 0

使用道具 舉報

推薦
發(fā)表于 2024-8-30 17:02:44 | 只看該作者
本帖最后由 學者11 于 2024-8-30 17:10 編輯

我覺得是你的提問就顯得欠缺語法,比如第一個問題,換成“在視覺深度學習領域,之前用2000張圖像訓練過的目標檢測模型,現(xiàn)在新加入幾張NG圖像是否可以進行重新訓練?”,這種描述是不是更好?
答案是當然可以,然而在這樣做之前,你需要考慮以下幾個方面:
數(shù)據(jù)一致性:確保新的圖像與原來的訓練集在數(shù)據(jù)分布上保持一致,避免引入數(shù)據(jù)偏移。
數(shù)據(jù)質(zhì)量:“NG圖像”的質(zhì)量可能會對訓練過程產(chǎn)生影響。如果這些圖像是低質(zhì)量的或者標注有誤,那么它們可能會影響模型的整體性能。
數(shù)據(jù)量影響:雖然添加少量圖像通常不會顯著改變模型的行為,但如果這些圖像具有很強的代表性或包含重要的特征,則有可能對模型產(chǎn)生積極的影響。反之,如果這些圖像的質(zhì)量較差,也有可能導致模型性能下降。
如果你擔心新的圖像會對現(xiàn)有模型造成負面影響,可以嘗試使用遷移學習的方法,僅微調(diào)模型的部分層而不是整個網(wǎng)絡。
另外,也可以采用增量學習的方法,這樣模型可以逐步適應新的數(shù)據(jù)而不完全忘記舊的數(shù)據(jù)上的學習成果。

人家不愿意回答采用的是哪種深度學習框架也很正常,這屬于商業(yè)機密。

你問人家ONNX推理的事,對方只會認為你有惡意。因為通過ONNX,開發(fā)者可以使用一種深度學習框架訓練模型,然后在另一種框架或者專門的高性能推理引擎中運行這個模型。所以對方會想,你該不會想偷我們的模型,然后在你們公司的框架上運行這個模型吧。人家賣的是服務,沒打算把家賣給你啊。

所以根本原因是你的提問已經(jīng)大大超過了一個普通用戶的需求,很多是創(chuàng)業(yè)者才會想到的。




點評

NO  發(fā)表于 2024-8-30 22:51
回復 支持 1 反對 0

使用道具 舉報

推薦
發(fā)表于 2024-8-30 23:10:42 | 只看該作者
那些視覺軟件基本上都內(nèi)嵌了大把的算法庫,隨便改改就可以用了,比如說Halcon
回復 支持 1 反對 0

使用道具 舉報

推薦
發(fā)表于 2024-8-30 15:13:26 | 只看該作者
這5個問題都不知道,那還不如我,至少我知道
我是不是也能去做視覺產(chǎn)品了
回復 支持 0 反對 1

使用道具 舉報

4#
發(fā)表于 2024-8-30 21:17:19 | 只看該作者
回復

使用道具 舉報

7#
發(fā)表于 2024-8-31 21:50:40 | 只看該作者
學者11 發(fā)表于 2024-8-30 17:02
我覺得是你的提問就顯得欠缺語法,比如第一個問題,換成“在視覺深度學習領域,之前用2000張圖像訓練過的目 ...

本質(zhì)被你看到了。
回復 支持 反對

使用道具 舉報

8#
發(fā)表于 2024-9-2 07:59:50 | 只看該作者
大有前途啊
回復 支持 反對

使用道具 舉報

9#
發(fā)表于 2024-9-2 10:27:16 | 只看該作者
會不會覺得你是同行提問

點評

哈哈哈  發(fā)表于 2024-9-2 10:28
回復 支持 反對

使用道具 舉報

10#
發(fā)表于 2024-9-2 10:30:26 | 只看該作者
我們就是拿樣品過去給他做視覺分析  OK后 我再拿一批料過去給他判斷,拿判斷過的產(chǎn)品OK  NG 回來公司用自己的檢測方法判斷他們的視覺是否可行,可以就買 不行就在商量 或者換一家

點評

對,傳統(tǒng)視覺用這種方式可行;但是涉及到AI層面,需要謹慎,因為現(xiàn)在這方面的資源也是魚龍混雜。好多是二道販子啊。  發(fā)表于 2024-9-2 10:37
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 注冊會員

本版積分規(guī)則

小黑屋|手機版|Archiver|機械社區(qū) ( 京ICP備10217105號-1,京ICP證050210號,浙公網(wǎng)安備33038202004372號 )

GMT+8, 2024-11-18 08:44 , Processed in 0.059315 second(s), 18 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回復 返回頂部 返回列表