常见图像处理的简易使用工具,包含有读图、存图、转灰阶、二元化、连通找出物体等。
Speech2Text APP 可训练音文件,使用 tensorflow 模型分析所选择的音档,输出其类别,达到 speech to text 的功能。
pix2pix 架构和 GAN 类似,但不在于产生仿真的影像,而是希望透过监督学习的方式,让原影像输出训练学习的影像风格。例如 : 黑白转换成彩色、边缘图转换相片、地图转换成卫星地图等各种应用。
此 APP是将一张低分辨率(Low Resolution)的影像,利用 SRGAN 生成一张高分辨率 (High Resolution),提高影像的分辨率。
CycleGAN 是发表在 ICCV2017 image-to-image translation 的著名算法,最大特点为不要求训练数据要成对,只需要提供不同 domain 的影像就能成功训练不同 domain 之间的影像转换。 可应用于语义卷标的街道转换成写实影像、卫星影像转换成地图影像、将场景从白天转换成夜晚。
人体姿势侦测,侦测出人体鼻子、眼睛、耳朵、脖子、肩部、手肘、手腕、髋关节、膝关节、脚踝的位置。
模型转换,从 yolo PyTorh 模型转换到 ONNX 模型,或是 Tensorflow 1.X 模型转换到 ONNX 模型。
FaceNet 主要验证人脸是否为同一个人,端对端学习,直接比对两个人脸经过它的网络映像之后的欧氏距离。该模型没有使用传统 softmax 的方式进行分类学习,而是抽取某一层当作特征,将人脸影像映像到一个欧几里得多维空间的编码方法,通过空间距离来表示人脸的相似度,同一个人的距离越小,反之不同人距离则越大。最后基于此编码再做人脸辨识、人
使用 UNet 进行影像分割,如上图,可以应用于医疗影像切割,此范例为胸腔 CT 影像切割。
使用 XGBoost-Regression-Time-Series 进行时序性资料的回归分析。
使用 LSTM (Long Short-Term Memory) 进行时序性资料的分析。
使用 CSPResNeXt50 进行影像分类,范例是使用钢板瑕疵分类。此 APP 可以让您自行替换成自己的影像来完成影像分类。
使用 XGBoost Classification 进行数据的分类。
此 APP 是一套结合多种影像标注工具的应用程序,主要包含有常见的LabelImg、Labelme 与立达软件独家开发的 Annotation 标注工具,支持 PASCAL VOC XML、YOLO、labelme、VIA JSON 等多种常见标注格式。
使用 XGBoost Regression 进行数据的回归分析。
使用 MaskRCNN 算法进行影像物件计数及切割,可以应用在医疗影像分析丶鱼类影像分析丶生物影像分析丶先进驾驶辅助系统丶自动驾驶车丶工厂瑕疵检测等。
YOLOv4 APP 可以应用在工厂瑕疵检测、医疗影像分析、生物影像分析、工安影像分析、口罩影像分析等。