복합 시스템들의 제어를 위한 무작위화된 강화 학습
기관명 | NDSL |
---|---|
출원인 | 지멘스 악티엔게젤샤프트 |
출원번호 | 10-2020-7015583 |
출원일자 | 2020-05-29 |
공개번호 | 20200611 |
공개일자 | 0000-00-00 |
등록번호 | |
등록일자 | 0000-00-00 |
권리구분 | KUPA |
초록 | 복합 시스템(50)을 제어하는 방법(10a; 10b) 및 방법(10a; 10b)에 의해 제어되는 가스 터빈(50)이 제공된다.방법(10a; 10b)은, 트레이닝 데이터(40)를 제공하는 단계(11) ―이 트레이닝 데이터(40)는, 시스템(50)의 상태 공간(S)의 적어도 일부를 표현함―; 시스템(50)에 대한 일반 제어 목적(32) 및 대응하는 설정점(33)을 설정하는 단계(12); 및 예상 총 보상을 최대화하는, 시스템(50)에 대한 제어 정책을 위해, 강화 학습을 사용하여 상태 공간(S)을 탐색하는 단계(13)를 포함한다.예상 총 보상은, 대응하는 설정점(33)으로부터 일반 제어 목적(32)의 무작위화된 편차(31)에 따라 좌우된다. |
원문URL | http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=KUPA&cn=KOR1020207015583 |
첨부파일 |
과학기술표준분류 | |
---|---|
ICT 기술분류 | |
IPC분류체계CODE | G05B-013/02,G06N-003/04,G06N-003/08 |
주제어 (키워드) |