Métodos de reconhecimento estatístico. Métodos de reconhecimento “Significado físico” e terminologia

Métodos de reconhecimento estatístico. Métodos de reconhecimento “Significado físico” e terminologia

Dentre os métodos técnicos de diagnóstico, o método baseado na fórmula generalizada de Bayes ocupa um lugar especial pela sua simplicidade e eficiência.

É claro que o método Bayes tem desvantagens: grande quantidade de informações preliminares, “supressão” de diagnósticos raros, etc. Porém, nos casos em que o volume de dados estatísticos permite a utilização do método Bayes, é aconselhável utilizá-lo como um dos métodos mais confiáveis ​​e eficazes.

Noções básicas do método. O método é baseado em uma fórmula simples de Bayes. Se houver um diagnóstico Eu e um simples sinal k j , ocorrendo com este diagnóstico, então a probabilidade de ocorrência conjunta de eventos (a presença da condição no objeto Eu e assine k j)

P (D eu k j) = P (D i) P ( k j/D i) = P ( k j)P(Di/ k j). (5.4)

A fórmula de Bayes segue esta igualdade (ver Capítulo 11)

P(D eu / k j) = P(D eu) P( k eu /D eu)/P( k j) (5.5)

É muito importante determinar o significado exato de todas as quantidades incluídas nesta fórmula.

P(Eu) - probabilidade de diagnóstico Eu, determinado a partir de dados estatísticos ( probabilidade prévia de diagnóstico). Então, se previamente examinado N objetos e N eu objetos tinham uma condição Eu, Que

P(Eu) = N eu/N. (5.6)

P(k j/Eu) - k j para objetos com estado Eu. Se entre N eu objetos com diagnóstico Eu, sim N ij apareceu um sinal k j , Que

P(k j/Eu) = Nij/Ni. (5.7)

P(k j) - probabilidade de ocorrência de um sinal k j em todos os objetos, independentemente do estado (diagnóstico) do objeto. Deixe o número total N sinal de objetos k j foi descoberto Nj objetos, então

P( k j ) = Nj/N. (5.8)

Para estabelecer um diagnóstico, um cálculo especial P(kj) não requerido. Como ficará claro a partir do que se segue , valores P(Eu)E P(k j/ Eu), conhecido para todos os estados possíveis, determine o valor P(k j).

Igualdade (3.2) P(Eu/k j)- probabilidade de diagnóstico Eu depois de se saber que o objeto em questão tem a característica k j (probabilidade posterior de diagnóstico).

Fórmula generalizada de Bayes. Esta fórmula aplica-se ao caso em que o exame é realizado de acordo com um conjunto de sinais PARA, incluindo sinais k 1 , k 2 , ..., k v. Cada um dos sinais k j Tem eu j classificações ( k j eu, k j 2 , ..., k js, ..., ). Como resultado do exame, a implementação da característica torna-se conhecida

k j *= k js(5.9)

e todo o complexo de signos K*. Índice *, como antes, significa o significado específico (realização) do atributo. A fórmula de Bayes para um complexo de recursos tem a forma

P(Eu/PARA* )= P(Eu)P(PARA */Eu)/P(PARA* )(eu= 1, 2, ..., n), (5.10)

Onde P(Eu/PARA* ) - probabilidade de diagnóstico Eu depois que os resultados do exame de um conjunto de sinais foram conhecidos PARA, P(Eu) - probabilidade preliminar de diagnóstico Eu(de acordo com estatísticas anteriores).

A fórmula (5.10) se aplica a qualquer um dos n possíveis estados (diagnósticos) do sistema. Supõe-se que o sistema esteja em apenas um dos estados indicados e, portanto,

Em problemas práticos, muitas vezes é permitida a possibilidade da existência de vários estados. A 1 , ..., Um, e alguns deles podem ocorrer em combinação entre si. Então, como vários diagnósticos Eu condições individuais devem ser consideradas D 1 = A 1 , ..., Dr.= Um e suas combinações Dr. +1 = A 1 ^ A 2, ... etc.

Vamos passar para a definição P(PARA*/ Eu). Se um conjunto de características consiste em v sinais, então

P(PARA*/ Eu) = P( k 1 */ Eu)P(k 2 */k 1* Eu)...P(k v*/k eu*...k*v- 1 Eu), (5.12)

Onde k j* = k js- categoria de um sinal revelado como resultado do exame. Para sinais diagnosticamente independentes

P(PARA*/ Eu) = P(k 1 */ Eu) P(k 2 */ Eu)... P(kv*/ Eu). (5.13)

Na maioria dos problemas práticos, especialmente com um grande número de traços, é possível aceitar a condição de independência dos traços mesmo na presença de correlações significativas entre eles.

Probabilidade de aparecimento de um complexo de sinais PARA*

P(PARA *)= P(Ds)P(PARA */Ds). (5.14)

A fórmula generalizada de Bayes pode ser escrita da seguinte forma :

P(Eu/K* ) (5.15)

Onde P(PARA*/ Eu)é determinado pela igualdade (5.12) ou (5.13). Das relações (5.15) segue

P(Eu/PARA *)=eu , (5.16)

o que, claro, é como deveria ser, já que um dos diagnósticos se realiza necessariamente, e a realização de dois diagnósticos ao mesmo tempo é impossível.

Ressalta-se que o denominador da fórmula de Bayes é o mesmo para todos os diagnósticos. Isso nos permite primeiro determinar as probabilidades de co-ocorrência eu o diagnóstico e dada a implementação de um complexo de sinais

P(EuPARA *) = P(Eu)P(PARA */Eu) (5.17)

e então a probabilidade posterior de diagnóstico

P(Eu/PARA *) = P(Eu PARA *)/ P(Ds PARA *). (5.18)

Observe que às vezes é aconselhável usar o logaritmo preliminar da fórmula (5.15), pois a expressão (5.13) contém produtos de pequenas quantidades.

Se a implementação de um determinado conjunto de recursos PARA * é determinando para diagnóstico DP, então este complexo não ocorre em outros diagnósticos:

Então, em virtude da igualdade (5.15)

(5.19)

Assim, a lógica determinística do diagnóstico é um caso especial de lógica probabilística. A fórmula de Bayes também pode ser usada no caso em que alguns dos recursos têm distribuição discreta e a outra parte tem distribuição contínua. Para distribuição contínua, são utilizadas densidades de distribuição. Porém, no plano de cálculo, a diferença de características especificada é insignificante se a definição de uma curva contínua for realizada a partir de um conjunto de valores discretos.

Matriz de diagnóstico. Para determinar a probabilidade de diagnósticos pelo método Bayesiano, é necessária a criação de uma matriz diagnóstica (Tabela 5.1), que é formada com base em material estatístico preliminar. Esta tabela contém as probabilidades das categorias de caracteres para vários diagnósticos.

Tabela 5.1

Matriz diagnóstica no método Bayes

Se os sinais forem de dois dígitos (sinais simples “sim - não”), então na tabela basta indicar a probabilidade de o sinal aparecer P (ki eu /D eu). Probabilidade de recurso ausente R( /D,-) = 1 - P (ki eu /D eu).

No entanto, é mais conveniente usar uma forma uniforme, assumindo, por exemplo, para um sinal de dois dígitos R (k j/D i)= R(k eu 1 /Eu); R( /D,) = P (k eu 2 /D eu).

Observe que P(kjs/Di)= 1, onde T, - número de dígitos do atributo k j. A soma das probabilidades de todas as implementações possíveis de um recurso é igual a um.

A matriz diagnóstica inclui probabilidades de diagnóstico a priori. O processo de aprendizagem no método Bayes consiste na formação de uma matriz diagnóstica. É importante prever a possibilidade de esclarecimento da tabela durante o processo diagnóstico. Para fazer isso, não apenas os valores devem ser armazenados na memória do computador P(kjs/Di), mas também as seguintes quantidades: N- o número total de objetos utilizados para compilar a matriz de diagnóstico; N eu- número de objetos com diagnóstico Eu; N ij- número de objetos com diagnóstico Eu, examinado com base em k j. Se um novo objeto com diagnóstico chegar , então as probabilidades de diagnóstico a priori anteriores são ajustadas da seguinte forma:

(5.20)

A seguir, são introduzidas correções nas probabilidades dos recursos. Deixe o novo objeto com o diagnóstico descarga detectada R sinal k j. Então, para diagnósticos adicionais, novos valores dos intervalos de probabilidade do recurso são aceitos k j após o diagnóstico :

(5.21)

As probabilidades condicionais de sinais para outros diagnósticos não requerem ajuste.

Exemplo. Vamos explicar o método Bayes. Deixe dois sinais serem verificados ao observar um motor de turbina a gás: k 1 - aumento da temperatura do gás atrás da turbina em mais de 50 °C e k 2- aumento do tempo para atingir a velocidade máxima em mais de 5 s. Suponhamos que para um determinado tipo de motor o aparecimento destes sintomas esteja associado quer a um mau funcionamento do regulador de combustível (condição D 1 ,), ou com aumento da folga radial na turbina (estado D 2).

Quando o motor está em condições normais (condição D 3) sinal k 1 não é observado, mas um sinal k 2 é observado em 5% dos casos. Com base em dados estatísticos, sabe-se que 80% dos motores apresentam uma vida útil em condições normais, 5% dos motores apresentam uma condição D 1 e 15% - condição D2. Sabe-se também que o sinal k 1 ocorre na condição D 1 em 20%, e em caso de condição D2 em 40% dos casos; sinal k 2 em condição D 1 ocorre em 30%, e na condição D2- em 50% dos casos. Vamos resumir esses dados em uma tabela de diagnóstico (Tabela 5.2).

Vamos primeiro encontrar as probabilidades dos estados do motor quando ambos os sinais são detectados k 1 e k 2 . Para isso, considerando os sinais independentes, aplicamos a fórmula (5.15).

Probabilidade de estado

Da mesma forma obtemos P (D 2 /k 1 k 2) = 0,91; P (D 3 /k 1k 2)= 0.

Vamos determinar a probabilidade de condições do motor se o exame mostrar que não há aumento de temperatura (sinal k 1), mas o tempo para atingir a velocidade máxima aumenta (sinal k 2 observado). Ausência de sinal k 1 há um sinal de presença (o evento oposto) e P (/Di)= 1 - P (k 1 /Di).

Para o cálculo também é utilizada a fórmula (5.15), mas o valor P (k 1 /Di) na tabela de diagnóstico é substituído por P (/Di). Nesse caso

e da mesma forma P (D 2 / k 2)= 0,46; P (D 3 / k 2)= 0,41. Calculemos as probabilidades dos estados no caso em que ambos os sinais estão ausentes. Semelhante ao anterior, obtemos

Observe que as probabilidades dos estados D1 E D 2 são diferentes de zero, pois as características consideradas não são determinantes para eles. A partir dos cálculos efetuados, pode-se constatar que se houver indícios k 1 E k 2 o motor tem uma condição com probabilidade 0,91 D1, aqueles. aumento da folga radial. Na ausência de ambos os sinais, a condição mais provável é normal (probabilidade 0,92). Na ausência de um sinal k 1 e a presença de um sinal k 2 probabilidades de estado D2 E D3 aproximadamente o mesmo (0,46 e 0,41) e exames adicionais são necessários para esclarecer o estado do motor.

Tabela 5.2

Probabilidades de recursos e probabilidades de estados anteriores

Regra decisiva- a regra segundo a qual é tomada uma decisão sobre o diagnóstico. No método Bayes, um objeto com um complexo de recursos PARA * refere-se ao diagnóstico com maior probabilidade (posterior)

K*D eu,Se P(D eu / K*) > P(D j / K*) (j = 1, 2,..., n; eu ≠ j). (5.22)

Símbolo , usado na análise funcional, significa pertencer a um conjunto. A condição (5.22) indica que um objeto que possui uma determinada implementação de um complexo de recursos PARA * ou, em suma, implementação PARA * pertence ao diagnóstico (condição) D eu. A regra (5.22) geralmente é refinada com a introdução de um valor limite para a probabilidade de diagnóstico:

P (D eu /K *) P eu, (5.23)

Onde Pi.- pré-selecionado nível de reconhecimento para diagnóstico Eu. Neste caso, a probabilidade do diagnóstico concorrente mais próximo não é superior a 1 – P eu. Geralmente aceito P eu≥ 0,9. Dado que

P(D eu /K *)

(5.24)

não é tomada uma decisão sobre o diagnóstico (recusa de reconhecimento) e são necessárias informações adicionais.

O processo de tomada de decisão no método Bayes ao calcular em um computador é bastante rápido. Por exemplo, fazer um diagnóstico para 24 condições com 80 sinais multidígitos leva apenas alguns minutos em um computador com velocidade de 10 a 20 mil operações por segundo.

Conforme indicado, o método Bayes apresenta algumas desvantagens, por exemplo, erros no reconhecimento de diagnósticos raros. Nos cálculos práticos, é aconselhável realizar diagnósticos para o caso de diagnósticos igualmente prováveis, colocando

P(D i) = l/n (5.25)

Então o diagnóstico terá o maior valor de probabilidade posterior Eu, para qual R (K* /D eu) máximo:

K*D eu,Se P( K*/D i) > P( K*/D j)(j = 1, 2,..., n; eu ≠ j). (5.26)

Em outras palavras, um diagnóstico é feito Eu se este conjunto de sintomas for mais comum durante o diagnóstico Eu do que com outros diagnósticos. Esta regra de decisão corresponde método de máxima verossimilhança. Resulta do anterior que este método é um caso especial do método Bayes com as mesmas probabilidades prévias de diagnósticos. No método de máxima verossimilhança, os diagnósticos “comuns” e “raros” têm direitos iguais.

Para confiabilidade de reconhecimento, a condição (5.26) deve ser complementada com um valor limite

P(K */D i) ≥ P i ,(5.27)

Onde P eu- nível de reconhecimento pré-selecionado para diagnóstico D eu.

Até à data, foram desenvolvidos um grande número de métodos, cuja utilização permite reconhecer o tipo de estado técnico do objeto diagnosticado. Este artigo discute apenas alguns deles, os mais utilizados na prática diagnóstica.

Método Bayesiano

O método diagnóstico baseado na aplicação da fórmula de Bayes refere-se aos métodos de reconhecimento estatístico.

Probabilidade de evento A, que pode ocorrer apenas quando ocorre um dos eventos incompatíveis 2? 1? EM 2 ,..., Em p, igual à soma dos produtos das probabilidades de cada um desses eventos pela probabilidade correspondente do evento A:

Esta fórmula é chamada a fórmula da probabilidade total. O corolário do teorema da multiplicação e da fórmula da probabilidade total é a chamada teoria das hipóteses. Suponhamos que o evento A pode ocorrer apenas quando um dos eventos incompatíveis ocorre EM, ÀS 2, ..., Em p, mas como não se sabe de antemão qual delas ocorrerá, são chamadas de hipóteses. A probabilidade de ocorrência de um evento A é determinada usando a fórmula de probabilidade total (1.5), e a probabilidade condicional R A (B/) de acordo com a fórmula

Substituindo o valor R(L), Nós temos

A fórmula (1.6) é chamada de fórmula de Bayes. Permite que as probabilidades das hipóteses sejam reestimadas após serem conhecidos os resultados do ensaio em que o evento ocorreu. A.

Identificar a magnitude das probabilidades condicionais de ocorrência de uma característica é fundamental para usar a fórmula de Bayes para diagnosticar uma condição. A abordagem bayesiana é amplamente utilizada na ciência de controle, na teoria de detecção de sinais e reconhecimento de padrões e em diagnósticos médicos e técnicos.

Consideremos a essência do método em relação à tarefa diagnóstica. O lado matemático da questão é apresentado detalhadamente no trabalho Ts3]. Durante a operação, qualquer objeto pode estar em um dos estados possíveis TVj, ...,NJ(no caso mais simples - “norma”, “recusa”), aos quais são atribuídas as hipóteses (diagnósticos) Z)j,...,Z); . Durante a operação da instalação, os parâmetros (sinais) são monitorados Para, ..., kj. Probabilidade da presença conjunta do estado Z)- e do atributo em um objeto kj determinado

Onde R(Dj)- probabilidade de diagnóstico DJ, determinado por dados estatísticos:

Onde P- número de objetos pesquisados;

Nova Jersey- número de estados;

P(kj/Dj) kj para objetos com estado Dj. Se entre P objetos com diagnóstico DJ, mostrou um sinal kj, Que

P(cr- probabilidade de ocorrência de um sinal kj em todos os objetos, independentemente da condição (diagnóstico) do objeto. Deixe do número total P sinal de objetos kj foi encontrado em rij objetos, então

P(Dj/kj) - probabilidade de diagnóstico Z); depois de se saber que o objeto em questão tem a característica Para-.

A fórmula generalizada de Bayes aplica-se ao caso em que o inquérito é realizado de acordo com um conjunto de características PARA, incluindo sinais (ku, k p). Cada um dos sinais kj Tem rrij classificações (, Para d,

kj2 , ..., kj, ..., k jm). Como resultado do exame, fica conhecido

implementação do recurso k.-k. e todo o complexo de signos PARA. Em-

deke significa o significado específico de um recurso. A fórmula de Bayes para um conjunto de recursos tem a forma

Onde P(Dj/A*) - probabilidade de diagnóstico? D após o resultado de um exame baseado em um conjunto de sinais ser conhecido PARA;

P(Dj)- probabilidade preliminar de diagnóstico Dj.

Supõe-se que o sistema esteja em apenas um dos estados indicados, ou seja,

Para determinar a probabilidade de diagnóstico pelo método Bayes, é formada uma matriz diagnóstica com base em material estatístico preliminar (Tabela 1.1). O número de linhas corresponde ao número de diagnósticos possíveis. O número de colunas é calculado como a soma dos produtos do número de características e o número correspondente de dígitos mais um para as probabilidades anteriores de diagnósticos. Esta tabela contém as probabilidades das categorias de caracteres para vários diagnósticos. Se reconhecido

ki dois dígitos (sinais simples “sim - não”), então na tabela basta indicar a probabilidade de ocorrência do sinal R(k-/Dj). Probabilidade de recurso ausente I. Mais conveniente

use uma forma uniforme, assumindo, por exemplo, um sinal de dois dígitos. Deve ser esclarecido que , Onde nij- número de dígitos do atributo kj. A soma das probabilidades de todas as implementações possíveis de um recurso é igual a um. A regra de decisão é a regra segundo a qual é tomada a decisão sobre o diagnóstico. No método Bayes, um objeto com um complexo de recursos pés refere-se ao diagnóstico com maior probabilidade (posterior) ft e Dj, Se P(Dj/lt) >

> P(Dj/ft) (J - 1, 2, ..., n eu * j). Esta regra é geralmente refinada através da introdução de um valor limite para a probabilidade de diagnóstico P(Dj/ft) >

>Pj, Onde Pj- nível de reconhecimento pré-selecionado para diagnóstico Dj. Neste caso, a probabilidade do diagnóstico concorrente mais próximo não é superior a 1 - Pj. Geralmente aceito P ( > 0,9. Dado que PiD/t?) não é tomada uma decisão sobre o diagnóstico e são necessárias informações adicionais.

Tabela 1.1

Matriz diagnóstica no método Bayes

Sinal kj

R(k 12 /

R(k 22 /

R(k p /

Exemplo. Uma locomotiva a diesel está sob vigilância. Neste caso, dois sinais são verificados: Para- aumento do consumo horário de gasóleo na posição nominal do controlador do condutor em mais de 10% do valor nominal, para 2- redução da potência do grupo gerador a diesel na posição nominal do controlador do motorista em mais de 15% do valor nominal. Suponhamos que o aparecimento destes sinais esteja associado quer ao aumento do desgaste das peças do grupo cilindro-pistão (diagnóstico /)]), ou ao mau funcionamento do equipamento de combustível (diagnóstico D2). Se o motor diesel estiver em boas condições (diagnóstico D 3) sinal Para não observado, mas um sinal para 2 observado em 7% dos casos. De acordo com dados estatísticos, foi estabelecido que 60% dos motores diagnosticados com Z) 3 são modificados antes dos reparos programados. D2- 30%, com diagnóstico Z)j - 10%. Também foi constatado que o sinal Para j no estado Z)| ocorre em 10%, e na condição D 2 - em 40% dos casos; sinal para 2 sob o estado Z)| ocorre em 15%, e na condição D2- em 20% dos casos. Apresentamos as informações iniciais em forma de tabela. 1.2.

Tabela 1.2

Probabilidades de condições e manifestações de sintomas

R(k 2 / A)

Vamos calcular as probabilidades de estado para várias opções de implementação de recursos controlados:

1. Sinais Para E para 2 encontrado, então:

2. Assine Para detectado, sinal para 2 ausente.

Ausência de sinal k eu significa a presença de um sinal Para.(o evento oposto) e P(k./D.)-- P(k./D.).

3. Assine Para 2 detectado, sinal Para ausente:

4. Sinais /:| E para 2 ausente:

A análise dos resultados dos cálculos obtidos permite-nos tirar as seguintes conclusões:

  • 1. Presença de dois sinais k e k 2 s probabilidade 0,942 indica a condição DJ
  • 2. Presença de um sinal Para com probabilidade de 0,919 indica a condição D2(mau funcionamento do equipamento de combustível).
  • 3. Presença de um sinal para 2 com probabilidade de 0,394 indica a condição D2(mau funcionamento do equipamento de combustível) e com probabilidade de 0,459 sobre o estado Z) 3 (condição adequada). Com tal razão de probabilidade, a tomada de decisão é difícil, sendo necessários exames adicionais.
  • 4. A ausência de ambos os sinais com probabilidade de 0,717 indica uma boa condição (Z) 3).
Nome do parâmetro Significado
Tópico do artigo: Método Bayesiano
Rubrica (categoria temática) Tecnologias

Definindo tarefas de diagnóstico técnico

Principais direções de diagnóstico técnico

Noções básicas de diagnóstico técnico

SEÇÃO Nº 5

Definições. O termo “diagnóstico” vem da palavra grega “diagnóstico”, que significa reconhecimento, determinação.

Durante o processo diagnóstico, um diagnóstico é estabelecido, ᴛ.ᴇ. é determinada a condição do paciente (diagnóstico médico) ou o estado do sistema técnico (diagnóstico técnico).

O diagnóstico técnico é geralmente chamado de ciência do reconhecimento do estado de um sistema técnico.

Objetivos do diagnóstico técnico. Consideremos brevemente o conteúdo principal dos diagnósticos técnicos. O diagnóstico técnico estuda métodos de obtenção e avaliação de informações diagnósticas, modelos diagnósticos e algoritmos de tomada de decisão. O objetivo do diagnóstico técnico é aumentar a confiabilidade e a vida útil dos sistemas técnicos.

Como se sabe, o indicador de confiabilidade mais importante é a ausência de falhas durante a operação (operação) de um sistema técnico. A falha de um motor de aeronave durante as condições de voo, de máquinas de navio durante a viagem de um navio ou de usinas de energia operando sob carga pode levar a consequências graves.

O diagnóstico técnico, graças à detecção precoce de defeitos e avarias, permite eliminar tais falhas durante o processo de manutenção, o que aumenta a fiabilidade e eficiência de funcionamento, e também permite operar sistemas técnicos críticos de acordo com o seu estado.

Na prática, a vida útil de tais sistemas é determinada pelas cópias “mais fracas” dos produtos. Durante a operação baseada em condições, cada amostra é operada até sua condição limite, de acordo com as recomendações do sistema de diagnóstico técnico. A operação baseada em condições pode trazer benefícios equivalentes ao custo de 30% da frota total de veículos.

As principais tarefas do diagnóstico técnico. O diagnóstico técnico resolve uma ampla gama de problemas, muitos dos quais estão relacionados com problemas de outras disciplinas científicas. A principal tarefa do diagnóstico técnico é reconhecer o estado de um sistema técnico em condições de informações limitadas.

Os diagnósticos técnicos são às vezes chamados de diagnósticos no local, ou seja, diagnósticos realizados sem desmontar o produto. A análise do estado é realizada em condições operacionais nas quais a obtenção de informações é extremamente difícil. Muitas vezes não é possível tirar uma conclusão inequívoca da informação disponível e é necessário utilizar métodos estatísticos.

A teoria geral do reconhecimento de padrões deve ser considerada a base teórica para resolver o principal problema do diagnóstico técnico. Esta teoria, que constitui uma seção importante da cibernética técnica, trata do reconhecimento de imagens de qualquer natureza (geométrica, sonora, etc.), reconhecimento mecânico de fala, textos impressos e manuscritos, etc. O diagnóstico técnico estuda algoritmos de reconhecimento aplicados a problemas de diagnóstico, que geralmente podem ser considerados problemas de classificação.

Os algoritmos de reconhecimento em diagnósticos técnicos baseiam-se parcialmente em modelos de diagnóstico que estabelecem uma ligação entre os estados de um sistema técnico e os seus mapeamentos no espaço de sinais de diagnóstico. Uma parte importante do problema de reconhecimento são as regras de decisão (regras de decisão).

A resolução de um problema de diagnóstico (classificar um produto como utilizável ou defeituoso) está sempre associada ao risco de um alarme falso ou de perder um alvo. Para tomar uma decisão informada, é aconselhável utilizar métodos da teoria estatística da decisão, desenvolvidos pela primeira vez em radar.

A solução de problemas de diagnóstico técnico está sempre associada à previsão de confiabilidade para o próximo período de operação (até a próxima inspeção técnica). Aqui, as decisões devem ser baseadas em modelos de falha estudados na teoria da confiabilidade.

A segunda área importante do diagnóstico técnico é a teoria da controlabilidade. A controlabilidade é geralmente chamada de propriedade de um produto para fornecer uma avaliação confiável de seu

condição técnica e detecção precoce de falhas e falhas. A controlabilidade é criada pelo design do produto e pelo sistema de diagnóstico técnico adotado.

Uma tarefa importante da teoria da capacidade de controle é o estudo dos meios e métodos de obtenção de informações diagnósticas. Sistemas técnicos complexos utilizam monitoramento automatizado de condições, que envolve o processamento de informações de diagnóstico e a geração de sinais de controle. Os métodos para projetar sistemas de controle automatizados constituem uma das áreas da teoria da capacidade de controle. Finalmente, tarefas muito importantes da teoria da controlabilidade estão relacionadas ao desenvolvimento de algoritmos de detecção de falhas, ao desenvolvimento de testes de diagnóstico e à minimização do processo de estabelecimento de um diagnóstico.

Devido ao fato de os diagnósticos técnicos terem sido inicialmente desenvolvidos apenas para sistemas radioeletrônicos, muitos autores identificam a teoria do diagnóstico técnico com a teoria da controlabilidade (detecção e monitoramento de falhas), o que, obviamente, limita o escopo de aplicação dos diagnósticos técnicos.

Estrutura do diagnóstico técnico. Na Fig. A Figura 5.1 mostra a estrutura dos diagnósticos técnicos. É caracterizada por duas direções interpenetrantes e interligadas: a teoria do reconhecimento e a teoria do controle. A teoria do reconhecimento contém seções relacionadas à construção de algoritmos de reconhecimento, regras de decisão e modelos de diagnóstico. A teoria da controlabilidade inclui o desenvolvimento de ferramentas e métodos para obtenção de informações de diagnóstico, controle automatizado e solução de problemas. O diagnóstico técnico deve ser considerado como uma seção da teoria geral da confiabilidade.

Arroz. 5.1. Estrutura de diagnóstico técnico

Observações introdutórias. Seja necessário determinar o estado da conexão estriada dos eixos da caixa de engrenagens nas condições de operação. Com o desgaste excessivo das estrias, aparecem distorções e danos por fadiga. A inspeção direta das estrias é impossível, pois requer a desmontagem da caixa de engrenagens, ou seja, a interrupção da operação. Um mau funcionamento da conexão estriada pode afetar o espectro de vibração da carcaça da caixa de engrenagens, vibrações acústicas, teor de ferro no óleo e outros parâmetros.

A tarefa do diagnóstico técnico é determinar o grau de desgaste das estrias (a profundidade da camada superficial destruída) com base nos dados de medição de vários parâmetros indiretos. Conforme indicado, uma das características importantes do diagnóstico técnico é o reconhecimento em condições de informação limitada, quando é necessário guiar-se por determinadas técnicas e regras para tomar uma decisão informada.

Estado do sistemaé descrito por um conjunto (conjunto) de seus parâmetros definidores (recursos). É claro que o conjunto de parâmetros de definição (características) deve ser diferente, principalmente em relação à tarefa de reconhecimento em si. Por exemplo, para reconhecer o estado de uma conexão estriada de motor, um determinado grupo de parâmetros é suficiente, mas deve ser complementado se outras peças também forem diagnosticadas.

Reconhecimento do estado do sistema- atribuição do estado do sistema a uma das classes possíveis (diagnósticos). O número de diagnósticos (classes, condições típicas, padrões) depende das características do problema e dos objetivos do estudo.

Muitas vezes é necessário selecionar um de dois diagnósticos (diagnóstico diferencial ou dicotomia); por exemplo, “estado defeituoso” e “estado defeituoso”. Em outros casos, é extremamente importante caracterizar mais detalhadamente a condição de defeito, por exemplo, aumento do desgaste das estrias, aumento da vibração das lâminas, etc. Na maioria das tarefas técnicas de diagnóstico, os diagnósticos (classes) são estabelecidos antecipadamente, e nestes condições, a tarefa de reconhecimento é frequentemente chamada de tarefa de classificação.

Como o diagnóstico técnico está associado ao processamento de uma grande quantidade de informações, a tomada de decisões (reconhecimento) é muitas vezes realizada por meio de computadores eletrônicos (computadores).

O conjunto de ações sequenciais no processo de reconhecimento é geralmente chamado algoritmo de reconhecimento. Uma parte essencial do processo de reconhecimento é seleção de parâmetros, descrevendo o estado do sistema. Devem ser suficientemente informativos para que, dado o número de diagnósticos selecionado, o processo de separação (reconhecimento) possa ser realizado.

Formulação matemática do problema. Em tarefas de diagnóstico, o estado do sistema é frequentemente descrito através de um conjunto de sinais

K =(k eu , k 2 ,..., k j,..., k v), (5.1)

Onde k j- um sinal que tem eu j descargas.

Deixe, por exemplo, um sinal k jé um sinal de três dígitos ( eu j= 3), caracterizando a temperatura do gás atrás da turbina: reduzida, normal, aumentada. Cada dígito (intervalo) do sinal k j denotado por k js, por exemplo, aumento da temperatura atrás da turbina k j h. Na verdade, o estado observado corresponde a uma determinada implementação da característica, que é indicada pelo sobrescrito *. Por exemplo, em temperaturas elevadas, a implementação da característica k * j = k j h.

Em geral, cada instância do sistema corresponde a alguma implementação de um conjunto de funcionalidades:

K* = (k 1 * , k 2 * ,..., k j *,..., kv*). (5.2)

Em muitos algoritmos de reconhecimento é conveniente caracterizar o sistema por parâmetros x-j, formando v- vetor dimensional ou ponto em v-espaço dimensional:

X =(x eu, x 2 , x-j,,xv). (5.3)

Na maioria dos casos os parâmetros x-j tem uma distribuição contínua. Por exemplo, deixe x-j- um parâmetro que expressa a temperatura atrás da turbina. Suponhamos que a correspondência entre o parâmetro x-j(°C) e sinal de três dígitos k jé isto:

< 450 para j eu

450 - 550 para j 2

> 500 para j 3

EM neste caso, usando o sinal k j uma descrição discreta é obtida, enquanto o parâmetro x-j fornece uma descrição contínua. Observe que, com uma descrição contínua, geralmente é necessária uma quantidade muito maior de informações preliminares, mas a descrição é mais precisa. Se, no entanto, as leis estatísticas de distribuição do parâmetro forem conhecidas, a quantidade necessária de informações preliminares será reduzida.

Está claro do anterior que não há diferenças fundamentais ao descrever um sistema usando recursos ou parâmetros, e ambos os tipos de descrição serão usados ​​no futuro.

Conforme indicado, em problemas de diagnóstico técnico os possíveis estados do sistema - diagnósticos Eu- são considerados famosos.

Existem duas abordagens básicas para o problema de reconhecimento: probabilístico e determinístico. Formulação do problema com métodos de reconhecimento probabilísticos este é o caso. Existe um sistema que está em um dos estados aleatórios Eu. É conhecido um conjunto de sinais (parâmetros), cada um dos quais caracteriza o estado do sistema com uma certa probabilidade. É necessária a construção de uma regra de decisão com a qual o conjunto de sinais apresentado (diagnosticado) seria atribuído a uma das condições possíveis (diagnósticos). Também é aconselhável avaliar a confiabilidade da decisão tomada e o grau de risco de uma decisão errônea.

Com métodos de reconhecimento determinísticos, é conveniente formular o problema em linguagem geométrica. Se o sistema for caracterizado v vetor tridimensional X , então qualquer estado do sistema é um ponto no espaço v-dimensional de parâmetros (recursos). Supõe-se que o diagnóstico D corresponda a alguma região do espaço de características considerado. É necessário encontrar uma regra de decisão segundo a qual o vetor apresentado X * (o objeto a ser diagnosticado) será atribuído a uma área específica de diagnóstico. Assim, a tarefa se resume a dividir o espaço de recursos em áreas de diagnóstico.

Com uma abordagem determinística, os domínios de diagnósticos são geralmente considerados “não sobrepostos”, ᴛ.ᴇ. a probabilidade de um diagnóstico (em cuja área cai o ponto) é igual a um, a probabilidade dos outros é igual a zero. Da mesma forma, presume-se que cada sintoma esteja presente em um determinado diagnóstico ou ausente.

As abordagens probabilísticas e determinísticas não apresentam diferenças fundamentais. Os métodos probabilísticos são mais gerais, mas muitas vezes requerem uma quantidade muito maior de informações preliminares. As abordagens determinísticas descrevem mais brevemente os aspectos essenciais do processo de reconhecimento, são menos dependentes de informações redundantes e de baixo valor e são mais consistentes com a lógica do pensamento humano.

Os capítulos seguintes descrevem os algoritmos básicos de reconhecimento para tarefas técnicas de diagnóstico.

Dentre os métodos técnicos de diagnóstico, o método baseado na fórmula generalizada de Bayes ocupa um lugar especial pela sua simplicidade e eficiência.

É claro que o método Bayes tem desvantagens: grande quantidade de informações preliminares, “supressão” de diagnósticos raros, etc.
Postado em ref.rf
Além disso, nos casos em que o volume de dados estatísticos permite a utilização do método Bayesiano, é aconselhável utilizá-lo como um dos métodos mais confiáveis ​​​​e eficazes.

Noções básicas do método. O método é baseado em uma fórmula simples de Bayes. Se houver um diagnóstico Eu e um simples sinal k j , ocorrendo com este diagnóstico, então a probabilidade de ocorrência conjunta de eventos (a presença da condição no objeto Eu e assine k j)

P (D eu k j) = P (D i) P ( k j/D i) = P ( k j)P(Di/ k j). (5.4)

A fórmula de Bayes segue esta igualdade (ver Capítulo 11)

P(D eu / k j) = P(D eu) P( k eu /D eu)/P( k j) (5.5)

É muito importante determinar o significado exato de todas as quantidades incluídas nesta fórmula.

P(Eu) - probabilidade de diagnóstico Eu, determinado a partir de dados estatísticos ( probabilidade prévia de diagnóstico). Então, se previamente examinado N objetos e N eu objetos tinham uma condição Eu, Que

P(Eu) = N eu/N. (5.6)

P(k j/Eu) - k j para objetos com estado Eu. Caso entre N eu objetos com diagnóstico Eu, sim N ij apareceu um sinal k j , Que

P(k j/Eu) = Nij/Ni. (5.7)

P(k j) - probabilidade de ocorrência de um sinal k j em todos os objetos, independentemente do estado (diagnóstico) do objeto. Deixe o número total N sinal de objetos k j foi descoberto Nj objetos, então

P( k j ) = Nj/N. (5.8)

Para estabelecer um diagnóstico, um cálculo especial P(kj) não requerido. Como ficará claro a partir do que se segue , valores P(Eu)E P(k j/ Eu), conhecido para todos os estados possíveis, determine o valor P(k j).

Igualdade (3.2) P(Eu/k j)- probabilidade de diagnóstico Eu depois de se saber que o objeto em questão tem a característica k j (probabilidade posterior de diagnóstico).

Fórmula generalizada de Bayes. Esta fórmula aplica-se ao caso em que o exame é realizado de acordo com um conjunto de sinais PARA, incluindo sinais k 1 , k 2 , ..., k v. Cada um dos sinais k j Tem eu j classificações ( k j eu, k j 2 , ..., k js, ..., ). Como resultado do exame, a implementação da característica torna-se conhecida

k j *= k js(5.9)

e todo o complexo de signos K*. Índice *, como antes, significa o significado específico (realização) do atributo. A fórmula de Bayes para um complexo de recursos tem a forma

P(Eu/PARA* )= P(Eu)P(PARA */Eu)/P(PARA* )(eu= 1, 2, ..., n), (5.10)

Onde P(Eu/PARA* ) - probabilidade de diagnóstico Eu depois que os resultados do exame de um conjunto de sinais foram conhecidos PARA, P(Eu) - probabilidade preliminar de diagnóstico Eu(de acordo com estatísticas anteriores).

A fórmula (5.10) se aplica a qualquer um dos n possíveis estados (diagnósticos) do sistema. Supõe-se que o sistema esteja em apenas um dos estados indicados e, portanto,

Em problemas práticos, muitas vezes é permitida a possibilidade da existência de vários estados. A 1 , ..., Um, e alguns deles podem ocorrer em combinação entre si. Então, como vários diagnósticos Eu condições individuais devem ser consideradas D 1 = A 1 , ..., Dr.= Um e suas combinações Dr. +1 = A 1 ^ A 2, ... etc.

Vamos passar para a definição P(PARA*/ Eu). Se o complexo de sinais consiste em v sinais, então

P(PARA*/ Eu) = P( k 1 */ Eu)P(k 2 */k 1* Eu)...P(k v*/k eu*...k*v- 1 Eu), (5.12)

Onde k j* = k js- categoria de um sinal revelado como resultado do exame. Para sinais diagnosticamente independentes

P(PARA*/ Eu) = P(k 1 */ Eu) P(k 2 */ Eu)... P(kv*/ Eu). (5.13)

Na maioria dos problemas práticos, especialmente com um grande número de traços, é possível aceitar a condição de independência dos traços mesmo na presença de correlações significativas entre eles.

Probabilidade de aparecimento de um complexo de sinais PARA*

P(PARA *)= P(Ds)P(PARA */Ds). (5.14)

A fórmula generalizada de Bayes deve ser escrita assim :

P(Eu/K* ) (5.15)

Onde P(PARA*/ Eu)é determinado pela igualdade (5.12) ou (5.13). Das relações (5.15) segue

P(Eu/PARA *)=eu , (5.16)

o que, claro, é como deveria ser, já que um dos diagnósticos se realiza necessariamente, e a realização de dois diagnósticos ao mesmo tempo é impossível.

Ressalta-se que o denominador da fórmula de Bayes é o mesmo para todos os diagnósticos. Isso nos permite primeiro determinar as probabilidades de co-ocorrência eu o diagnóstico e dada a implementação de um complexo de sinais

P(EuPARA *) = P(Eu)P(PARA */Eu) (5.17)

e então a probabilidade posterior de diagnóstico

P(Eu/PARA *) = P(Eu PARA *)/P(Ds PARA *). (5.18)

Observe que às vezes é aconselhável usar o logaritmo preliminar da fórmula (5.15), pois a expressão (5.13) contém produtos de pequenas quantidades.

Se a implementação de um determinado conjunto de recursos PARA * é determinando para diagnóstico DP, então este complexo não ocorre em outros diagnósticos:

Então, em virtude da igualdade (5.15)

(5.19)

Contudo, a lógica determinística do diagnóstico é um caso especial de lógica probabilística. A fórmula de Bayes também pode ser usada no caso em que alguns dos recursos têm distribuição discreta e a outra parte tem distribuição contínua. Vale dizer que para distribuição contínua são utilizadas densidades de distribuição. Além disso, no plano de cálculo, a diferença especificada nas características é insignificante se a curva contínua for especificada usando um conjunto de valores discretos.

Matriz de diagnóstico. Para determinar a probabilidade de diagnósticos pelo método bayesiano, é extremamente importante a criação de uma matriz diagnóstica (Tabela 5.1), que é formada com base em material estatístico preliminar. Esta tabela contém as probabilidades das categorias de caracteres para vários diagnósticos.

Tabela 5.1

Matriz diagnóstica no método Bayes

Diagnóstico Eu Assine k j P(D eu)
k 1 k 2 k3
P(k 11 /D i) P(k 12 /D i) P(k 13 /D i) P(k 21 /D i) P(k 22 /D i) P(k 23 /D i) P(k 24 /D i) P(k 31 /D i) P(k 32 /D i)
D1 0,8 0,2 0,1 0,1 0,6 0,2 0,2 0,8 0,3
D2 0,1 0,7 0,2 0,3 0,7 0,1 0,9 0,1

Se os sinais forem de dois dígitos (sinais simples “sim - não”), então na tabela basta indicar a probabilidade de ocorrência do sinal P (ki eu /D eu). Probabilidade de recurso ausente R( /D,-) = 1 - P (ki eu /D eu).

Neste caso, é mais conveniente utilizar um formulário uniforme, assumindo, por exemplo, para um atributo de dois dígitos R (k j/D i)= R(k eu 1 /Eu); R( /D,) = P (k eu 2 /D eu).

Observe que P(kjs/Di)= 1, onde T, - número de dígitos do atributo k j. A soma das probabilidades de todas as implementações possíveis do atributo é igual a um.

A matriz diagnóstica inclui probabilidades de diagnóstico a priori. O processo de aprendizagem no método Bayes consiste na formação de uma matriz diagnóstica. É importante prever a possibilidade de esclarecimento da tabela durante o processo diagnóstico. Para fazer isso, não apenas os valores devem ser armazenados na memória do computador P(kjs/Di), mas também as seguintes quantidades: N- o número total de objetos utilizados para compilar a matriz de diagnóstico; N eu- número de objetos com diagnóstico Eu; N ij- número de objetos com diagnóstico Eu, examinado com base em k j. Se um novo objeto com diagnóstico chegar , então as probabilidades de diagnóstico a priori anteriores são ajustadas da seguinte forma:

(5.20)

A seguir, são introduzidas correções nas probabilidades dos recursos. Deixe o novo objeto com o diagnóstico descarga detectada R sinal k j. Neste caso, para diagnósticos posteriores, são aceitos novos valores dos intervalos de probabilidade da característica k j após o diagnóstico :

(5.21)

As probabilidades condicionais de sinais para outros diagnósticos não requerem ajuste.

Exemplo. Vamos explicar o método Bayes. Deixe dois sinais serem verificados ao observar um motor de turbina a gás: k 1 - aumento da temperatura do gás atrás da turbina em mais de 50 °C e k 2- aumento do tempo para atingir a velocidade máxima em mais de 5 s. Suponhamos que para este tipo de motor o aparecimento destes sintomas esteja associado quer a um mau funcionamento do regulador de combustível (estado D 1 ,), ou com aumento da folga radial na turbina (estado D 2).

Quando o motor está em condições normais (condição D 3) sinal k 1 não é observado, mas um sinal k 2 é observado em 5% dos casos. Com base em dados estatísticos, sabe-se que 80% dos motores apresentam uma vida útil em condições normais, 5% dos motores apresentam uma condição D 1 e 15% - condição D2. Sabe-se também que o sinal k 1 ocorre na condição D 1 em 20%, e em caso de condição D2 em 40% dos casos; sinal k 2 em condição D 1 ocorre em 30%, e na condição D2- em 50% dos casos. Vamos resumir esses dados em uma tabela de diagnóstico (Tabela 5.2).

Vamos primeiro encontrar as probabilidades dos estados do motor quando ambos os sinais são detectados k 1 e k 2 . Para isso, considerando os sinais independentes, aplicamos a fórmula (5.15).

Probabilidade de estado

Da mesma forma obtemos P (D 2 /k 1 k 2) = 0,91; P (D 3 /k 1k 2)= 0.

Vamos determinar a probabilidade de condições do motor se o exame mostrar que não há aumento de temperatura (sinal k 1 2 são diferentes de zero, pois as características consideradas não são determinantes para eles. A partir dos cálculos efetuados, pode-se constatar que se houver indícios k 1 E k 2 no motor com probabilidade 0,91 existe uma condição D1,ᴛ.ᴇ. aumento da folga radial. Na ausência de ambos os sinais, a condição mais provável é normal (probabilidade 0,92). Na ausência de um sinal k 1 e a presença de um sinal k 2 probabilidades de estado D2 E D3 aproximadamente o mesmo (0,46 e 0,41) e exames adicionais são necessários para esclarecer o estado do motor.

Tabela 5.2

Probabilidades de recursos e probabilidades de estados anteriores

Eu P(k 1 /D eu) P(k 2 /D eu) P(D eu)
D1 0,2 0,3 0,05
D2 0,4 0,5 0,15
D3 0,0 0,05 0,80

Regra decisiva- a regra segundo a qual é tomada uma decisão sobre o diagnóstico. No método Bayes, um objeto com um complexo de recursos PARA * refere-se ao diagnóstico com maior probabilidade (posterior)

K*D eu,Se P(D eu / K*) > P(D j / K*) (j = 1, 2,..., n; eu ≠ j). (5.22)

Símbolo , usado na análise funcional, significa pertencer a um conjunto. A condição (5.22) indica que um objeto que possui uma determinada implementação de um complexo de recursos PARA * ou, em suma, implementação PARA * pertence ao diagnóstico (condição) D eu. A regra (5.22) geralmente é refinada com a introdução de um valor limite para a probabilidade de diagnóstico:

P (D eu /K *) P eu, (5.23)

Onde Pi.- pré-selecionado nível de reconhecimento para diagnóstico Eu. Neste caso, a probabilidade do diagnóstico concorrente mais próximo não é superior a 1 – P eu. Geralmente aceito P eu≥ 0,9. Dado que

P(D eu /K *)

(5.24)

não é tomada uma decisão sobre o diagnóstico (recusa de reconhecimento) e são necessárias informações adicionais.

O processo de tomada de decisão no método Bayes ao calcular em um computador é bastante rápido. Por exemplo, fazer um diagnóstico para 24 condições com 80 sinais multidígitos leva apenas alguns minutos em um computador com velocidade de 10 a 20 mil operações por segundo.

Conforme indicado, o método Bayes apresenta algumas desvantagens, por exemplo, erros no reconhecimento de diagnósticos raros. Nos cálculos práticos, é aconselhável realizar diagnósticos para o caso de diagnósticos igualmente prováveis, colocando

P(D i) = l/n (5.25)

Então o diagnóstico terá o maior valor de probabilidade posterior Eu, para qual R (K* /D eu) máximo:

K*D eu,Se P( K*/D i) > P( K*/D j)(j = 1, 2,..., n; eu ≠ j). (5.26)

Em outras palavras, um diagnóstico é feito Eu se este conjunto de sintomas for mais comum durante o diagnóstico Eu do que com outros diagnósticos. Esta regra de decisão corresponde método de máxima verossimilhança. Resulta do anterior que este método é um caso especial do método Bayes com as mesmas probabilidades prévias de diagnósticos. No método de máxima verossimilhança, os diagnósticos “comuns” e “raros” têm direitos iguais.

Vale dizer que para confiabilidade do reconhecimento, a condição (5.26) deve ser complementada com um valor limite

P(K */D i) ≥ P i ,(5.27)

Onde P eu- nível de reconhecimento pré-selecionado para diagnóstico D eu.

Método Bayes – conceito e tipos. Classificação e características da categoria “Método Bayes” 2017, 2018.

MÉTODO DE ANÁLISE SEQUENCIAL

MÉTODO BAYES

Esboço da palestra

Análise e verificação de trabalhos de casa

Tempo de organização.

Progresso da palestra.

Aula 9

Assunto. MÉTODOS DE RECONHECIMENTO ESTATÍSTICO

Alvo. Dê o conceito de reconhecimento de sinal digital.

1. Educacional. Explique o processo de reconhecimento de sinal digital.

2. Desenvolvimento. Desenvolva o pensamento lógico e uma visão de mundo científico-natural.

3. Educacional. Cultivar o interesse pelas conquistas e descobertas científicas na indústria de telecomunicações.

Conexões interdisciplinares:

· Apoio: ciência da computação, matemática, informática e MP, sistemas de programação.

· Oferecido: Estágio

Apoio metodológico e equipamentos:

1. Desenvolvimento metodológico da aula.

2. Currículo.

3. Currículo

4. Programa de trabalho.

5. Instruções de segurança.

Auxiliares de ensino técnico: computador pessoal.

Fornecendo empregos:

· Pastas de trabalho

3. Responda às perguntas:

1. Qual é a diferença entre sinais digitais e sinais analógicos?

2. Que classes de diagramas são usadas ao fazer medições?

3. Faça uma breve descrição de cada aula.

4. O que é usado para construir um diagrama ocular?

5. Explique a essência do diagrama ocular.

· Noções básicas do método

  • Fórmula generalizada de Bayes.

· Matriz diagnóstica.

Regra decisiva

· Fundamentos do método.

· Procedimento geral do método.

· Conexão dos limites de decisão com as probabilidades de erros do primeiro e segundo tipos.

A principal vantagem dos métodos de reconhecimento estatístico é a capacidade de levar em consideração simultaneamente sinais de diferentes naturezas físicas, uma vez que são caracterizados por quantidades adimensionais - as probabilidades de sua ocorrência em diferentes estados do sistema.

Entre os métodos técnicos de diagnóstico está um método baseado na fórmula generalizada de Bayes ( O teorema de Bayes (ou fórmula de Bayes) é um dos principais teoremas da teoria das probabilidades, que permite determinar a probabilidade de um evento (hipótese) ter ocorrido na presença apenas de evidências indiretas (dados), que podem ser imprecisas ), ocupa um lugar especial pela sua simplicidade e eficiência.

O método Bayes tem desvantagens:grande quantidade de informações preliminares, “supressão” de diagnósticos raros, etc. Porém, nos casos em que o volume de dados estatísticos permite a utilização do método Bayesiano, é aconselhável utilizá-lo como um dos métodos mais confiáveis ​​​​e eficazes.


Noções básicas do método. O método é baseado em uma fórmula simples de Bayes. Se houver um diagnóstico Eu e um simples sinal ki , ocorrendo com este diagnóstico, então a probabilidade de ocorrência conjunta de eventos (a presença do estado Di no objeto e o sinal ki )

Desta igualdade segue a fórmula de Bayes

(3.2)

É muito importante determinar o significado exato de todas as quantidades incluídas nesta fórmula.

P(Di) - probabilidade a priori da hipótese D

P(ki/Di) - a probabilidade da hipótese ki na ocorrência do evento D (probabilidade posterior - a probabilidade de um evento aleatório, desde que os dados posteriores sejam conhecidos, ou seja, obtidos após experimento.)

P(ki) - probabilidade total de ocorrência do evento ki

P(Di/ki) - probabilidade de ocorrência do evento Di se a hipótese ki for verdadeira

P(D) - probabilidade de diagnóstico D, determinado por dados estatísticos (probabilidade prévia de diagnóstico). Então, se previamente examinado N objetos e W,-objetos tinham estado D, então

P(D i) = N i /N.(3.3)

P (kj/Di) - probabilidade de ocorrência do recurso k j; para objetos com estado Di. Se entre Ni, objetos diagnosticados com Di, N ij apareceu um sinal k j Que

(3.4)

P (kj) - probabilidade de ocorrência de um sinal kj em todos os objetos, independentemente da condição (diagnóstico) do objeto. Deixe do número total N sinal de objetos Para ) foi encontrado em Nova Jersey objetos, então

(3.5)

Em igualdade (3.2) R ( Di/kj)- a probabilidade de diagnóstico D após se saber que o objeto em questão possui a característica kj (probabilidade posterior de diagnóstico ).

Douglas W. Hubbard Capítulo do livro “Como medir qualquer coisa. Estimativa do valor dos intangíveis nos negócios"
Editora "Olympus-Business"

Tabela 1. Linhas individuais da tabela de cálculos usando inversão Bayesiana

Parece que nossa retenção de clientes não é boa. Mas vamos recalcular o custo dessas informações e, embora diminua, ainda faz sentido fazer medições adicionais. Vamos selecionar mais 40 compradores e então teremos um total de 60 pessoas. Destes 60, apenas 39 dirão que voltarão à nossa loja. Nosso novo IC de 90% será de 69-80%. O limite superior agora é igual ao nosso limite crítico original de 80%, dando-nos 95% de confiança de que a taxa de compradores recorrentes é baixa o suficiente para exigir que façamos alterações importantes e dispendiosas.

Os cálculos acabaram sendo bastante complexos, mas lembre-se que você pode utilizar as tabelas disponibilizadas em nosso site de suporte. E é bem possível que o método bayesiano subjetivo discutido anteriormente, aplicado por especialistas calibrados, tivesse funcionado neste caso. Talvez uma pesquisa com o cliente revele fatores qualitativos que nossos especialistas calibrados poderão levar em consideração. No entanto, o custo destas medições importantes é suficientemente elevado para justificar o nosso esforço adicional.

Evite a inversão de observação

Muitas pessoas fazem a pergunta: “Que conclusão posso tirar desta observação?” Mas Bayes mostrou-nos que muitas vezes é mais útil perguntar: “O que devo observar se a condição X for válida?” A resposta à última pergunta permite-nos compreender a primeira.

Embora a inversão Bayesiana possa parecer muito trabalhosa à primeira vista, é um dos métodos de medição mais eficientes à nossa disposição. Se pudermos formular a pergunta “Qual é a probabilidade de ver X se Y for verdadeiro?” e transformá-lo em “Qual é a probabilidade de Y ser verdadeiro se observarmos X?”, então um grande número de problemas de medição podem ser resolvidos. Na verdade, é assim que encontramos respostas para a maioria das questões científicas. Se a hipótese proposta estiver correta, o que devemos observar?

Pelo contrário, muitos gestores parecem acreditar que toda medição se resume a encontrar respostas à pergunta: “O que devo concluir do que vejo?” Quando parece que foi cometido um erro de observação, as pessoas decidem que nenhuma conclusão pode ser tirada com base nisso, não importa quão baixa seja a probabilidade de tal erro. Contudo, a análise bayesiana mostra que os erros imaginados pelos gestores são extremamente improváveis ​​e que a medição ainda reduziria significativamente a incerteza existente. Em outras palavras, a falta de pelo menos uma compreensão teórica da inversão bayesiana leva à inversão da questão e à crença de que erros de baixa probabilidade reduzem o valor das medidas a zero - isto é, à forma mais infeliz de “inversão de observação”. .”

Notas

1 David M. Grether, Mahmoud A. El-Gamal. As pessoas são bayesianas? Descobrindo Estratégias Comportamentais // Documento de Trabalho em Ciências Sociais 919, 1995, Instituto de Tecnologia da Califórnia.

2 Tom DeMarco, Timothy Lister. Peopleware: Projetos e Equipes Produtivas. 2ª edição. Nova York: Dorset House Publishing, 1999.

FYP - lucro do primeiro ano, lucro do primeiro ano. - Observação. tradutor

Imprecisão: Um valor para a proporção da população é apresentado no Capítulo 9 (ver Figura 9.2). - Observação. editor.

Visualizações