본문 바로가기

소프트웨어/LSF13

Load Vectors란 (LSF) 00 개요LSF API 문서를 보면, Load Vectors라는 개념이 나오는 것에 대한 정리Load Indices를 표현하는 한 방법이 Load Vectors 임 (참조: 2024.08.30 - [소프트웨어/LSF] - Load Indices란 (LSF))https://www.ibm.com/docs/en/spectrum-lsf/10.1.0?topic=SSWRJV_10.1.0/api_reference/index.htm01 Load Vectors란1. 정의시스템의 자원 상태를 여러 차원으로 표현한 벡터각 차원은 시스템의 다양한 자원 지표 (예: CPU 사용률, 메모리 사용량, 디스크 I/O 등)를 나타냄예) 시스템의 상태를 [CPU 사용률, 메모리 사용량, 디스크 I/O]의 형태로 벡터화한 것이 load .. 2024. 8. 30.
Load Indices란 (LSF) 00 개요LSF API 문서를 보면, Load Indices라는 개념이 나오는 것에 대한 정리https://www.ibm.com/docs/en/spectrum-lsf/10.1.0?topic=SSWRJV_10.1.0/api_reference/index.htm01 Load Indices란1. 정의IBM Spectrum LSF의 문서에서 load indices는 시스템 자원의 사용 상태를 나타내는 수치이러한 수치는 작업을 스케줄링할 때 시스템의 부하를 고려하여 작업을 배치하는 데 사용됨구체적으로는, 각 시스템의 현재 상태를 나타내는 지표로서, 시스템의 CPU 사용률, 메모리 사용량, 디스크 I/O, 네트워크 대역폭 등을 포함2. 예시1) 웹 서버 클러스터의 작업 배치웹 서버 클러스터를 관리할 때, 이 클러스터.. 2024. 8. 30.
Trouble Shooting Notes (LSF) 1. LSF 데몬이 안 뜨는 경우1) lsb.status.lock 파일이 있는지 확인해보기경로: /sw/LSF/work/클러스터이름/logdir/stream/lsb.status.lock 2024. 8. 12.
EGO란 (LSF) 00 개요목적: LSF 설치 시 EGO를 활성화하는데 EGO가 무엇인지 정리하고자 함IBM Spectrum LSF V10.1.0 documentation > Administer LSF > Advanced configuration > Manage LSF on EGO > About LSF on EGOIBM Spectrum LSF V10.1.0 documentation > About LSF > Users > LSF with EGO enabled01 EGO란1. 정의'Enterprise Grid Orchestrator'provides a system infrastructure to control and manage cluster resources by enabling EGO자원(resource): physica.. 2024. 6. 26.
Resource (자원) 00 개요LSF를 공부하는데 자원에 따라 job을 할당하는 LSF의 역할 중 자원(resource)가 무엇인가에 대해 정리하고자 함01 자원이란 (Resources)1. 정의'resource'physical and logical entities that are used by applications to runWhile resource is a generic term, and can include low-level things such as shared memory segments or semaphoresIn LSF, EGO manages CPU slots.A resource of a particular type has attributese.g., a compute host has the attribute.. 2024. 6. 26.
External Load Indices, External Load Info Manager (elim) 00 개요elim이 뭔지 알고자 함01 External Load Indices란1. 역할External Load Indices 는 동적 외부 자원의 값들을 보고한다 (report the values of dynamic external resources)동적 외부 자원 (dynamic external resource): customer-defined 자원 (LSF 내 built-in resource가 아님) w/ a numeric value that changes over time예: the space available in a directoryuse the external load indices feature to make the values of dynamic external resources avai.. 2024. 6. 13.
LSF 데몬 관련 ERROR 00 개요목적: 흔한 LSF 문제를 다룸대부분의 문제들은 due to incorrect installation or configuration절차: error log files 먼저 확인해보기01 LIM 1. LIM dies quietly 절차Run the following command to check for errors in the LIM configuration files. # lsadmin ckconfig -vThis displays most configuration errorIf this does not report any errors, check in the LIM error log2. LIM unavailable설명sometimes the LIM is up, but executing the l.. 2024. 5. 13.
lsfstartup, lsfrestart, lsfshutdown (LSF 명령어) 01 lsfstartup1. 정의starts the LIM, RES, and sbatchd daemons on all hosts in the cluster (not including mbatchd???)2. 문법# lsfstartup -pdsh [-delay seconds] [-num_hosts number]# lsfstartup [-f]# lsfstartup [-h | -V]3. 설명can be only used by root or users who are listed in the lsf.sudoers filestart LIM, RES, and sbatchd daemons (이 순으로) on all hostswhen live configuration w/ the bconf command is enabl.. 2024. 4. 29.
LSF 빠른 참조 LSF commands, daemons, configuration files, log files, and important cluster configuration parameters에 대한 참조01 유닉스/리눅스 설치 디렉토리 샘플 (Sample UNIX and Linux installation directories)  02 데몬 에러 로그 파일 (Daemon Error Log Files)1. 경로경로파일lsf.conf 안에 LSF_LOGDIR로 지정된 경로 pim.log.host_name res.log.host_name lim.log.host_name 2. 종류LSF base 시스템 데몬 로그 파일LSF batch 시스템 데몬 로그 파일pim.log.host_namembatchd.log.host_n.. 2024. 4. 22.