Apprentissage profond

Microsoft.ML.TorchSharp

Microsoft.ML.TorchSharp.AutoFormerV2

var chain = new EstimatorChain<ITransformer> ( ) ; var filteredPipeline = chain. Append ( mlContext.Transforms.Text.TokenizeIntoWords ( labelColumnName, separators: [ ',' ] ) , TransformerScope.Training ) .Append ( mlContext.Transforms.Conversion.MapValueToKey ( labelColumnName ) , TransformerScope.Training ) .Append ( mlContext.Transforms.Text.TokenizeIntoWords ( boundingBoxColumnName, separators: [ ',' ] ) , TransformerScope.Training ) .Append ( mlContext.Transforms.Conversion.ConvertType ( boundingBoxColumnName ) , TransformerScope.Training ) .Append ( mlContext.Transforms.LoadImages ( "Image" , imageFolder, "ImagePath" ) ) .Append ( mlContext.MulticlassClassification.Trainers.ObjectDetection ( labelColumnName, predictedLabelColumnName, scoreColumnName, boundingBoxColumnName, predictedBoundingBoxColumnName, imageColumnName, maxEpoch ) ) .Append ( mlContext.Transforms.Conversion.MapKeyToValue ( predictedLabelColumnName ) ) ; var options = new ObjectDetectionTrainer.Options ( ) { LabelColumnName = labelColumnName, BoundingBoxColumnName = boundingBoxColumnName, ScoreThreshold = .5 , MaxEpoch = maxEpoch, LogEveryNStep = 1 , } ; var pipeline = mlContext.Transforms.Text.TokenizeIntoWords ( labelColumnName, separators: [ ',' ] ) .Append ( mlContext.Transforms.Conversion.MapValueToKey ( labelColumnName ) ) .Append ( mlContext.Transforms.Text.TokenizeIntoWords ( boundingBoxColumnName, separators: [ ',' ] ) ) .Append ( mlContext.Transforms.Conversion.ConvertType ( boundingBoxColumnName ) ) .Append ( mlContext.Transforms.LoadImages ( "Image" , imageFolder, "ImagePath" ) ) .Append ( mlContext.MulticlassClassification.Trainers.ObjectDetection ( options ) ) .Append ( mlContext.Transforms.Conversion.MapKeyToValue ( predictedLabelColumnName ) ) ; var model = pipeline.Fit ( data ) ; var idv = model.Transform ( data ) ; var metrics = ML.MulticlassClassification.EvaluateObjectDetection ( idv, idv.Schema [ 2 ] , idv.Schema [ boundingBoxColumnName ] , idv.Schema [ predictedLabelColumnName ] , idv.Schema [ predictedBoundingBoxColumnName ] , idv.Schema [ scoreColumnName ] ) ;

Microsoft.ML.TorchSharp

// QA trainer var chain = new EstimatorChain<ITransformer> ( ) ; var estimatorQA = chain.Append ( mlContext.MulticlassClassification.Trainers.QuestionAnswer ( contextColumnName, questionColumnName, trainingAnswerColumnName, answerIndexColumnName, predictedAnswerColumnName, scoreColumnName, topK, batchSize, maxEpochs, architecture, validationSet ) ) ; // NER trainer var estimatorNER = chain.Append ( mlContext.Transforms.Conversion.MapValueToKey ( "Label" , keyData ) ) .Append ( mlContext.MulticlassClassification.Trainers.NameEntityRecognition ( labelColumnName, outputColumnName, sentence1ColumnName, batchSize, maxEpochs, architecture, validationSet ) ) .Append ( mlContext.Transforms.Conversion.MapKeyToValue ( outputColumn ) ) ;

Les scénarios d'apprentissage profond ont été considérablement étendus dans cette version avec de nouvelles capacités dans la détection d'objets, la reconnaissance d'entités nommées et la réponse aux questions. Tout cela est possible grâce aux intégrations et à l'interopérabilité avec les modèles TorchSharp et ONNX. L'intégration avec LightGBM a également été mise à jour avec la dernière version.Les scénarios de traitement des données sont grandement améliorés grâce à une longue liste d'améliorations et de corrections de bogues apportées à, ainsi qu'à de nouvelles fonctionnalités d'interopérabilité avec. Les étapes importantes du chargement, de l'inspection, de la transformation et de la visualisation de vos données sont beaucoup plus puissantes.La liste complète des mises à jour est disponible dans les notes de version Au cours de l'année écoulée, nous avons tous été témoins d'une accélération de la croissance des scénarios et des capacités d'apprentissage profond. Avec ML.NET 3.0, vous pouvez tirer parti de bon nombre de ces avancées dans vos applications .NET.La détection d'objets est un problème de vision par ordinateur. Bien qu'elle soit étroitement liée à la classification d'images, la détection d'objets effectue la classification d'images à une échelle plus granulaire. La détection d'objets permet à la fois de localiser et de classer les entités dans les images. Il est préférable d'utiliser la détection d'objets lorsque les images contiennent plusieurs objets de types différents.La détection d'objets a été annoncée dans ML.NET Model Builder au début de l'année. Ces capacités s'appuient sur les API de détection d'objets alimentées par TorchSharp et introduites dans ML.NET 3.0.L'API de détection d'objets exploite certaines des dernières techniques de Microsoft Research et s'appuie sur une architecture de réseau neuronal basée sur Transformer et construite avec TorchSharp. Pour plus de détails sur le modèle sous-jacent, voir l'article Searching the Space of Vision Transformer Object Detection est inclus dans le package Microsoft.ML.TorchSharp 3.0.0 dans les espaces de nomset. Lisez l'article sur la détection d'objets dans ML.NET Model Builder pour un aperçu approfondi.Le traitement du langage naturel est l'un des besoins les plus courants en matière de ML dans les logiciels. La réponse aux questions (QA) et la reconnaissance des entités nommées (NER) sont deux des domaines où les progrès ont été les plus importants. Ces deux scénarios sont débloqués dans ML.NET 3.0 en s'appuyant sur les fonctions de classification de texte RoBERTa de TorchSharp introduites dans ML.NET 2.0.Les formateurs NER et QA sont inclus dans le package Microsoft.ML.TorchSharp 3.0.0 et dans l'espace de nomsPeu après la sortie de ML.NET 2.0, l'accélération matérielle de la formation par Intel oneDAL a été annoncée dans le cadre du premier aperçu de ML.NET 3.0. Intel oneDAL (Intel oneAPI Data Analytics Library) est une bibliothèque qui permet d'accélérer l'analyse des données en fournissant des blocs de construction algorithmiques hautement optimisés pour toutes les étapes du processus d'analyse des données et d'apprentissage automatique. Intel oneDAL utilise les extensions SIMD des architectures 64 bits, présentes dans les processeurs Intel et AMD.Reportez-vous à l'article Accelerate ML.NET training with Intel oneDAL pour en savoir plus sur cet ensemble de fonctionnalités.L'apprentissage automatique (AutoML) automatise le processus d'application de l'apprentissage automatique aux données. AutoML alimente des expériences telles que celles trouvées dans Model Builder et ML.NET CLI.Avec ML.NET 3.0, l'expérience AutoML s'est enrichie de plusieurs nouvelles fonctionnalités. Le balayeur AutoML prend désormais en charge la similarité des phrases, la réponse aux questions et la détection d'objets. Antti "Andy" Törrönen, membre de la communauté, a implémenté un nom de colonne de clé d'échantillonnage () qui peut être utilisé avecpour définir plus facilement le nom de la clé d'échantillonnage. Le tunerpeut maintenant être utilisé dans les expériences. Le nombre maximum de modèles utilisés pour une expérience peut être spécifié parGrâce au membre de la communauté Andras Fuchs, la surveillance continue des ressources est disponible via. Cela permet de surveiller la demande de mémoire, l'utilisation de la mémoire virtuelle et l'espace disque restant. Grâce à cette surveillance, les expériences de longue durée peuvent être contrôlées par une implémentation personnalisée d'afin d'éviter les plantages et les essais ratés.Cette version comprend une longue liste de mises à jour notables de, dont beaucoup ont été réalisées par un membre de la communauté, Aleksei Smirnov.Pour permettre plus de conversions, le support des types de colonneseta été ajouté. Les valeurssont gérées comme, et le type de colonnesupporte toutes les primitives de backing. Les colonnes peuvent désormais stocker plus de 2 Go de données, la limitation précédente ayant été supprimée. Les données des colonnes Apache Arrowsont également reconnues.Les scénarios de chargement de données pour lessont étendus dans ML.NET 3.0. Grâce à un membre de la communauté, Andrei Faber, il est désormais possible d'importer et d'exporter des données vers des bases de données SQL. Pour ce faire, on utilise ADO.NET, qui prend en charge un grand nombre de bases de données compatibles avec SQL. Dans le cadre de cette implémentation, il est également devenu possible de charger des données à partir de n'importe quelle collectionet d'exporter des données vers. Les données d'unpeuvent désormais être ajoutées à un autrelorsque les noms de leurs colonnes correspondent, ce qui permet d'assouplir une contrainte antérieure sur l'ordre des colonnes. Les données séparées par des virgules chargées parpeuvent maintenant gérer les noms de colonnes en double, avec l'option de renommer les colonnes en double.De nombreuses autres améliorations et corrections ont été apportées à. Les performances arithmétiques ont été améliorées dans les scénarios de clonage de colonnes et de comparaison binaire. La gestion des valeurs nulles a été améliorée lors des opérations arithmétiques, ce qui réduit le nombre d'étapes de transformation et de nettoyage des données. Des améliorations ont même été apportées au débogueur afin de produire des résultats plus lisibles pour les colonnes dont les noms sont longs.Tensor Primitives est l'abréviation de, un nouvel ensemble d'API qui introduit la prise en charge des opérations sur les tenseurs. Dans le cadre de .NET 8, l'équipe a publié un nouveau package System.Numerics.Tensors qui introduit les Tensor Primitives. Les API Tensor Primitives constituent la prochaine étape de l'évolution de Numerics for AI dans .NET, en s'appuyant sur l'élan des intrinsèques matérielles et des mathématiques génériques.Bien que l'intégration des Tensor Primitives soit un détail d'implémentation qui n'affecte pas la surface publique de ML.NET, elle apporte des améliorations de performance notables. Les résultats des tests suivants illustrent les gains réalisés en ciblant .NET 8.Plus de détails et les résultats du benchmark .NET Framework sont inclus dans la requête dotnet/machinelearning#6875 qui a introduit cette intégration.Au-delà de ces gains de performance, cette opportunité d'intégration a également permis de tester la forme, l'utilisabilité, la fonctionnalité et l'exactitude des API de. Prouver que les API pouvaient satisfaire les scénarios ML.NET a constitué une étape précieuse pour sortir le package System.Numerics.Tensors de la phase de prévisualisation avec une version 8.0.0 stable.Les versions .NET 8 et ML.NET 3.0 étant terminées, Microsoft travaille sur ses plans pour .NET 9 et ML.NET 4.0. Bien plus tôt, vous pouvez vous attendre à ce que Model Builder et ML.NET CLI soient mis à jour pour intégrer la version ML.NET 3.0.L'équipe continuera à développer les scénarios et les intégrations d'apprentissage profond, et à améliorer DataFrame. Les API disponibles dans System.Numerics.Tensors continueront d'être développées et intégrées à ML.NET. Restez à l'écoute pour connaître les plans détaillés de ML.NET 4.0.Que pensez-vous de ML.NET 3 ?Quelles sont les fonctionnalités de ML.NET que vous trouvez utiles et intéressantes ?